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内 容 简 介 


本 书 以 关系 数据 库 系 统 为 核心 ,全 面 介绍 了 数据 库 系统 的 基本 原理 。 全 书 共 10 章 , 主 要 内 容 包 括 数 
据 库 系统 基本 概念 、 关 系数 据 模式 、 关 系数 据 库 标 准 语言 SQL、 关 系数 据 库 理论 .查询 优化 ,数据库 保护 、 数 
据 库 应 用 系统 设计 数据库 编 程 .数据 库 产品 及 数据 库 技术 新 发 展 。 本 书 中 所 涉及 的 例子 均 以 学 生 学 习 过 
程 为 主线 ,每 章 后 均 附 有 习题 ,习题 答案 可 从 网 站 下 载 。 为 了 配合 教学 和 学 生 自 学 ,本 书 配 有 制作 精美 的 
PPT 课件 。 同 时 ,本 书 还 有 配套 教材 (数据 库 应 用 与 实践 指导 ) 对 实验 环节 进行 指导 。 

本 书 可 作为 普通 高 等 院 校 计算 机 及 相关 学 科 的 数据 库 课 程 教材 ,也 可 作为 数据 库 技术 的 自学 教材 和 
参考 书 。 
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浊 淹 识 明 


随 着 我 国 改革 开放 的 进一步 深化 ,高 等 教育 也 得 到 了 快速 发 展 ,各 地 高 校 紧密 结合 地 方 
经 济 建设 发 展 需要 ,科学 运用 市 场 调节 机 制 ,加 大 了 使 用 信息 科学 等 现代 科学 技术 提升 、 改 
造 传 统 学 科 专 业 的 投入 力度 ,通过 教育 改革 合理 调整 和 配置 了 教育 资源 ,优化 了 传统 学 科 专 
业 ,积极 为 地 方 经 济 建设 输送 人 才 , 为 我 国 经 济 社会 的 快速 ,健康 和 可 持续 发 展 以 及 高 等 教 
育 自身 的 改革 发 展 做 出 了 巨大 贡献 。 但 是 ,高 等 教育 质量 还 需要 进一步 提高 以 适应 经 济 社 
会 发 展 的 需要 ,不 少 高 校 的 专业 设置 和 结构 不 尽 合理 ,教师 队伍 整体 素质 蝇 待 提高 ,人 才 培 
养 模 式 ,教学 内 容 和 方法 需要 进一步 转变 ,学 生 的 实践 能 力 和 创新 精神 亚 待 加 强 。 

教育 部 一 直 十 分 重视 高 等 教育 质量 工作 。2007 年 1 月 ,教育 部 下 发 了 (关于 实施 高 等 
学 校本 科教 学 质量 与 教学 改革 工程 的 意见 》, 计 划 实 施 “ 高 等 学 校本 科教 学 质量 与 教学 改革 
工程 "(简称 “质量 工程 ”) ,通过 专业 结构 调整 ,课程 教材 建设 、 实 践 教学 改革 、 教 学 团队 建设 
等 多 项 内 容 , 进 一 步 深 化 高 等 学 校 教学 改革 ,提高 人 才 培养 的 能 力 和 水 平 , 更 好 地 满足 经 济 
社会 发 展 对 高 素质 人 才 的 需要 。 在 贯彻 和 落实 教育 部 "质量 工程 的 过 程 中 ,各 地 高 校 发 挥 
师资 力量 强 、 办 学 经 验 丰 富 教学 资源 充裕 等 优势 ,对 其 特色 专业 及 特色 课程 ( 群 ) 加 以 规划 、 
整理 和 总 结 ,更 新 教学 内 容 、 改 革 课 程 体系 ,建设 了 一 大 批 内 容 新 、 体 系 新 ,方法 新 、 手 段 新 的 
特色 课程 。 在 此 基础 上 ,经 教育 部 相关 教学 指导 委员 会 专家 的 指导 和 建议 ,清华 大 学 出 版 社 
在 多 个 领域 精 选 各 高 校 的 特色 课程 ,分 别 规划 出 版 系列 教材 ,以 配合 “质量 工程 ”的 实施 , 满 
足 各 高 校 教学 质量 和 教学 改革 的 需要 。 

为 了 深入 贯彻 落实 教育 部 (关于 加 强 高 等 学 校本 科教 学 工作 ,提高 教学 质量 的 若干 意 
见 ) 精 神 , 紧 密 配合 教育 部 已 经 启动 的 “高 等 学 校 教学 质量 与 教学 改革 工程 精品 课程 建设 工 
作 ”, 在 有 关 专 家 、 教 授 的 倡议 和 有 关 部 门 的 大 力 支持 下 ,我 们 组 织 并 成 立 了 “清华 大 学 出 版 
社 教材 编审 委员 会 "(以 下 简称 “ 编 委 会 ”) , 旨 在 配合 教育 部 制定 精品 课程 教材 的 出 版 规划 ， 
讨论 并 实施 精品 课程 教材 的 编写 与 出 版 工作 。“ 编 委 会 "成 员 皆 来 自 全 国 各 类 高 等 学 校 教学 
与 科研 第 一 线 的 骨干 教师 ,其 中 许多 教师 为 各 校 相关 院 、 系 主管 教学 的 院 长 或 系 主任 。 

按照 教育 部 的 要 求 ,“ 编 委 会 一致 认为 ,精品 课程 的 建设 工作 从 开始 就 要 坚持 高 标准 、 
严 要 求 , 处 于 一 个 比较 高 的 起 点 上 。 精 品 课程 教材 应 该 能 够 反映 各 高 校 教学 改革 与 课程 建 
设 的 需要 ,要 有 特色 风格 有 创新 性 (新 体系 、 新 内 容 、 新 手段 ,新 思路 ,教材 的 内 容 体系 有 较 
高 的 科学 创新 .技术 创新 和 理念 创新 的 含量 ) .先进 性 (对 原 有 的 学 科 体系 有 实质 性 的 改革 和 
发 展 ,顺应 并 符合 21 世纪 教学 发 展 的 规律 ,代表 并 引领 课程 发 展 的 趋势 和 方向 ) .示范 性 ( 教 
材 所 体现 的 课程 体系 具有 较 广 泛 的 辐射 性 和 示范 性 ) 和 一 定 的 前 瞻 性 。 教 材 由 个 人 申报 或 
各 校 推荐 (通过 所 在 高 校 的 “ 编 委 会 ”成员 推 荐 ) ,经 “ 编 委 会 ”认真 评审 ,最 后 由 清华 大 学 出 版 
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社 审定 出 版 。 


目前 ,针对 计算 机 类 和 电子 信息 类 相关 专业 成 立 了 两 个 “ 编 委 会 ”, 即 “清华 大 学 出 版 社 
计算 机 教材 编审 委员 会 "和 “清华 大 学 出 版 社 电子 信息 教材 编审 委员 会 "。 推 出 的 特色 精品 


教材 包括 : 


(1) 21 世纪 高 等 学 校规 划 教 材 * 


专业 的 计算 机 应 用 类 教材 。 
(2) 21 世纪 高 等 学 校规 划 教 材 
教材 。 


(3) 21 世纪 高 等 学 校规 划 教材 。 
(4) 21 世纪 高 等 学 校规 划 教材 。 
(5) 21 世纪 高 等 学 校规 划 教 材 。 
(6) 21 世纪 高 等 学 校规 划 教 材 。 
(7) 21 世纪 高 等 学 校规 划 教 材 。 
(8) 21 世纪 高 等 学 校规 划 教材 。 


计算 机 应 用 一 一 高 等 学 校 各 类 专业 ,特别 是 非 计算 机 


* 计算 机 科学 与 技术 一 一 高 等 学 校 计算 机 相关 专业 的 


电子 信息 一 一 高 等 学 校 电子 信息 相关 专业 的 教材 。 
软件 工程 一 一 高 等 学 校 软件 工程 相关 专业 的 教材 。 
信息 管理 与 信息 系统 。 

财经 管理 与 应 用 。 

电子 商务 。 

物 联网 。 


清华 大 学 出 版 社 经 过 二 十 多 年 的 努力 ,在 教材 尤其 是 计算 机 和 电子 信息 类 专业 教材 出 
版 方面 树立 了 权威 品牌 ,为 我 国 的 高 等 教育 事业 做 出 了 重要 贡献 。 清 华 版 教材 形成 了 技术 
准确 ,内容 严谨 的 独特 风格 ,这 种 风格 将 延续 并 反映 在 特色 精品 教材 的 建设 中 。 


清华 大 学 出 版 社 教材 编审 委员 会 
联系 人 : 魏 江 江 


E-mail: weijtup. tsinghua. edu. cn 


1. 编写 目的 


数据 库 技术 是 数据 管理 的 技术 ,是 计算 机 科学 的 重要 组 成 部 分 。 数 据 库 技术 自 20 世纪 
60 年 代 产生 至 今 已 有 近 50 年 的 历史 ,经 历 了 从 以 网 状 模型 和 层次 模型 为 特征 的 第 一 代数 
据 库 系统 .以 关系 模型 为 基础 的 第 二 代数 据 库 系统 ,到 今天 的 以 面向 对 象 为 主要 特征 .融合 
多 种 新 技术 的 第 三 代数 据 库 系 统 的 演变 过 程 ,产生 了 一 个 新 的 .巨大 的 软件 产业 ,推动 了 计 
算 机 技术 的 应 用 和 发 展 。 目 前 ,不 仅 在 各 种 机 型 上 配 有 数据 库 管 理 系统 ,各 行 各 业 的 信息 系 
统 , 甚 至 是 Internet 上 的 信息 系统 都 离 不 开 数 据 库 的 支持 。 因 此 ,数据 库 已 成 为 信息 社会 的 
重要 基础 设施 。 数 据 库 的 应 用 领域 非常 广 , 已 经 拓展 到 商业 、 医 疗 保健 ,教育 、 政 府 组 织 、 图 
书馆 ,军事 .工业 控制 等 诸多 领域 。 因 此 ,数据 库 技术 已 成 为 计算 机 技术 、 控 制 技术 、 信 息 技 
术 等 相关 专业 的 必修 课程 ,也 是 从 事 相关 领域 的 工程 技术 人 员 所 必须 具备 的 专业 知识 。 

本 书 由 浅 和 人 深 、 循 序 渐进 、 理 论 与 实践 并 重 ,力求 让 读者 通过 本 书 的 学 习 , 能 对 数据 库 技 
术 有 一 个 比较 全 面 的 了 解 ,掌握 数据 库 理论 的 基本 知识 ,对 数据 库 应 用 系统 的 开发 有 初步 的 
了 解 。 


2. 内 容 介绍 


本 书 共 分 为 十 章 , 各 章 的 主要 内 容 如 下 : 

第 1 章 概 要 介绍 数据 库 系 统 的 基本 概念 和 基本 结构 ,包括 数据 管理 的 发 展 、 数 据 库 管理 
系统 及 其 相关 概念 ,数据库 系统 结构 ,数据 模型 和 关系 数据 库 的 基本 概念 。 

第 2 章 系统 地 讲解 关系 数据 库 的 重要 概念 ,对 关系 模型 进行 描述 ; 并 通过 实例 详细 讲 
解 关系 代数 ,包括 传统 的 并 ,交差 , 笛 卡 儿 积 集合 操作 和 特殊 的 选择 ,投影 .连接 、 除 运算 。 

第 3 章 详 细 介 绍 关系 数据 库 标准 语言 SQL 的 组 成 .功能 和 特点 ,重点 介绍 数据 定义 、 数 
据 更 新 、 数 据 查询 ,数据 控制 语言 。 

第 4 章 全 面 介绍 关系 数据 库 , 包 括 关系 模型 .关系 模式 ,关系 代数 以 及 关系 数据 库 规范 
化 理论 。 

第 5 章 介绍 关系 型 数据 库 系 统 的 查询 优化 技术 ,主要 包括 RDBMS 查询 的 基本 处 理 过 
程 、 查 询 优 化 的 基本 概念 和 基本 方法 ,并 给 出 一 些 在 实际 应 用 中 的 查询 优化 方法 。 

第 6 章 详 细 介 绍 数据 库 保护 ,包括 数据 库 安全 性 、 完 整 性 、 并 发 控制 和 数据 库 恢 复 。 

第 7 章 介绍 关系 数据 库 设计 ,着 重 介绍 数据 库 设计 步骤 ,特别 是 数据 库 概念 结构 设计 和 
逻辑 结构 设计 。 

第 8 章 介绍 嵌入 式 SQL 语句 、 存 储 过 程 以 及 如 何 连 接 、 访 问 数 据 库 。 

第 9 章 简要 介绍 市 场 上 广泛 使 用 的 数据 库 产品 ,包括 SQL Server、ORACLE、 MySQL、 
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SA 


Sybase 和 DB2。 

第 10 章 介 绍 数据 库 技术 的 最 新 发 展 ,包括 面向 对 象 数据 库 、 分 布 式 数据 库 .Web 数据 
库 .数据 仓库 和 电子 商务 数据 库 。 

3. 适用 对 象 


本 书 可 作为 高 等 学 校本 科 和 研究 生 的 数据 库 技术 相关 课程 的 教材 或 参考 书 , 也 可 供 广 
大 从 事 数 据 库 技术 研究 、 开 发 与 应 用 的 工程 技术 人 员 参 考 。 


4. 建议 学 时 安排 
建议 课时 安排 
序 号 内 容 
第 1 章 数据 库 概述 


1 

2 第 2 章 关系 数据 库 系 统 
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信息 社会 ,数据 库 技术 的 发 展 已 经 成 为 先进 信息 技术 的 重要 组 成 部 分 , 绝 大 多 数 的 计算 
机 应 用 系统 都 离 不 开 数 据 库 的 支撑 。 数 据 库 领 域 有 着 自身 显著 的 特点 ,涉及 相当 多 的 概念 
和 理论 ,本章 将 逐步 引出 这 些 概念 ,使 读者 对 数据 库 技术 有 初步 的 认识 和 理解 。 


人; 计算 机 数据 管理 的 发 展 


1.1.1 数据 管理 
1. 数据 


数据 库 是 计算 机 信息 管理 的 基础 ,其 研究 对 象 是 数据 。 说 起 数据 ,人 们 首先 想到 的 是 数 
字 , 其 实数 字 只 是 最 简单 的 一 种 数据 。 数 据 的 种 类 很 多 , 它 不 仅仅 包括 数字 字母 ,文字 和 其 
他 特殊 符号 ,而 且 还 包括 图 形 、 图 像 声音 等 。 可 以 说 在 日 常生 活 中 数据 无 处 不 在 。 

数据 是 对 客观 事物 的 符号 表示 ,通常 以 一 组 "数字 ?组 成 ,是 用 以 表征 某 一 自然 客体 或 社 
会 客体 的 数量 或 质量 的 概念 , 即 数据 是 用 以 表征 物质 的 存在 .相互 关系 .运动 状态 和 变化 规 
律 的 一 组 “数字 ?的 组 合 。 

计算 机 处 理 的 数据 是 经 过 抽象 的 ,但 是 数据 本 身 及 其 解释 是 分 不 开 的 。 例 如 数据 87， 
这 可 能 是 某 个 人 心跳 的 频率 ,也 可 能 是 某 个 小 孩子 的 身高 ,甚至 可 能 是 桌子 的 宽度 。 所 以 ， 
离开 语义 解释 ,数据 就 失去 了 意义 。 

在 日 常生 活 中 ,人 们 直接 用 自然 语言 描述 事物 。 在 计算 机 中 ,为 了 存储 和 处 理 这 些 事 
物 ,就 要 抽出 对 这 些 事物 感 兴趣 的 特征 ,组 成 一 个 记录 来 描述 它 。 例 如 ,在 图 书记 录 中 ,如 果 
人 们 最 感 兴趣 的 是 图 书 的 书 名 、 作 者 、 出 版 社 、 出 版 时 间 、 价 格 , 则 可 以 这 样 描述 : (数据 库 原 
理 , 张 三 ,清华 大 学 出 版 社 ,2004 年 2 月 ,20. 50)。 

对 于 上 面 这 条 图 书记 录 , 了 解 其 语义 的 人 会 得 到 如 下 信息 : 数据 库 原理 是 一 本 书 , 作 者 
是 张 三 , 由 清华 大 学 出 版 社 于 2004 年 2 月 出 版 ,价格 为 20. 50 元 ; 而 不 了 解 其 语义 的 人 则 
无 法 理解 其 含义 。 可 见 ,数据 的 形式 本 身 并 不 能 完全 表达 其 内 容 , 需 要 经 过 语义 解释 。 数 据 
与 其 语义 是 不 可 分 的 。 


2. 数据 与 信息 
在 计算 机 科学 领域 ,数据 是 由 能 被 计算 机 识别 与 处 理 的 数值 .字符 等 符号 构成 的 集合 。 
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数据 只 是 信息 的 一 种 特定 的 符号 表示 形式 ,是 计算 机 程序 进行 “加工 ?的 原料 的 总 称 。 

信息 有 广义 和 狭义 之 分 。 广 义 的 信息 是 指 反映 客观 事物 的 特征 与 变化 的 资料 和 消息 。 
狭义 的 信息 是 指 经 过 加 工 、 整 理 , 被 接收 者 接收 ,并 对 其 完成 菜 项 业务 具有 使 用 价值 的 情报 
资料 和 消息 。 

数据 和 信息 的 含义 并 不 完全 相同 。 数 据 是 指 记载 下 来 的 事实 ,是 客观 实体 属性 的 值 ,而 
信息 是 一 种 已 经 被 加 工 为 特定 形式 的 数据 ,是 数据 所 表达 的 内 容 , 它 能 使 事物 的 不 确定 性 
减少 。 

数据 与 信息 有 着 不 可 分 割 的 联系 。 一 方面 ,数据 是 信息 的 符号 表示 ,或 称 载体 ; 信息 是 
经 过 加 工 的 数据 ,是 数据 的 内 涵 ,是 数据 的 语义 解释 。 另 一 方面 ,信息 是 抽象 的 ,不 随 数据 设 
备 决定 的 数据 形式 而 改变 ; 而 数据 的 表示 方式 却 具有 可 选择 性 。 

数据 处 理 是 指 将 数据 转换 成 信息 的 过 程 ,如 对 数据 的 采集 ,存储 、 传 播 \ 检 索 ,分 类 ,计算 
等 ,打印 各 类 报表 或 输出 各 种 需要 的 图 形 。 在 数据 处 理 的 一 系列 过 程 中 ,对 数据 的 采集 、 存 
储 、 传 播 .检索 、 分 类 .计算 等 操作 是 基本 环节 ,这 些 基 本 环节 统称 为 数据 处 理 。 


1.1.2 数据 库 技术 的 产生 和 发 展 


数据 管理 是 指 如 何 对 数据 进行 分 类 、 组 织 、 编 码 、 存 储 、 检 索 和 维护 , 它 是 数据 处 理 的 中 
心间 题 。 而 数据库 技术 正 是 应 数据 管理 任务 的 需要 而 产生 的 。 

随 着 计算 机 硬件 和 软件 的 发 展 , 数 据 管理 经 历 了 人 工 管理 ,文件 系统 和 数据 库 系统 三 个 
发 展 阶段 。 


1. 人 工 管理 阶段 


在 20 世纪 50 年 代 中 期 以 前 ,计算 机 数据 管理 的 能 力 很 差 ,这 一 阶段 称 为 人 工 管理 阶 
段 。 当 时 的 计算 机 硬件 存储 设备 只 有 纸 带 ,卡片 磁带 等 ,没有 磁盘 等 直接 存 取 的 存储 设备 ; 
软件 方面 没有 操作 系统 ,没有 管理 数据 的 软件 ; 数据 处 理 方式 是 批 处 理 ; 计算 机 主要 用 于 
科学 计算 。 

人 工 管理 数据 具有 如 下 特点 。 

(1) 数据 不 能 长 期 保存 

当时 计算 机 主要 用 于 科学 计算 ,一般 不 需要 将 数据 长 期 保存 ,只 是 在 计算 某 一 课题 时 将 
数据 输入 ,用 完 就 撤 走 。 不 仅 对 用 户 数 据 如 此 处 置 , 对 系统 软件 有 时 也 是 这 样 操作 。 

(2) 没有 软件 系统 负责 数据 的 管理 工作 

应 用 程序 中 不 仅 要 规定 数据 的 逻辑 结构 ,而 且 要 设计 物理 结构 ,包括 存储 结构 、 存 取 方 
法 、 输 入 方式 等 。 


应 用 程序 1 数据 集 1 


(3) 数据 不 具有 独立 性 
数据 的 逻辑 结构 或 物理 结构 发 生变 化 后 必须 修改 应 用 程 
应 用 程序 2 数据 集 | 序 , 这 就 进一步 加 重 了 程序 员 的 负担 。 
: : (4) 数据 不 能 共享 
应 用 程序 n 数据 集 n 数据 是 面向 应 用 的 ,一 组 数据 只 能 对 应 一 个 程序 ,如 图 1-1 
图 11 人工 管理 阶段 程序 所 示 。 即 使 多 个 应 用 程序 涉及 某 些 相同 的 数据 ,也 必须 各 自 定 
与 数据 的 对 应 关系 义 : 无 法 互相 利用 、 互 相 参 照 ,因此 有 大 量 的 元 余数 据 。 
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2. 文件 系统 阶段 


20 世纪 50 年 代 后 期 到 60 年 代 中 期 ,计算 机 应 用 逐渐 扩大 到 管理 ,计算 机 数据 管理 进 
入 到 文件 系统 阶段 。 这 时 硬件 已 有 磁盘 、 磁 鼓 等 直接 存 取 的 存储 设备 ; 软件 方面 ,操作 系统 
中 已 经 有 了 专门 的 数据 管理 软件 ,一般 称 为 文件 系统 ; 处 理 方式 上 不 仅 有 文件 批 处 理 , 而 且 
能 够 进行 联机 实时 处 理 。 
用 文件 系统 管理 数据 具有 如 下 特点 。 

(1) 数据 可 以 长 期 保存 

由 于 计算 机 大 量 用 于 数据 处 理 , 数 据 需 要 长 期 保留 在 外 存 上 ,反复 进行 查询 ,修改 \ 插 入 
和 删除 等 操作 ,因此 数据 与 程序 可 以 分 开 存储 。 

(2) 由 专门 的 软件 ( 即 文件 系统 ) 进 行 数据 管理 

程序 和 数据 之 间 由 软件 提供 的 存 取 方法 进行 转换 ,使 应 用 程序 与 数据 之 间 有 了 一 定 的 
独立 性 。 数 据 的 存 取 以 记录 为 基本 单位 ,并 出 现 了 多 种 文件 组 织 , 如 顺序 文件 ,索引 文件 和 
随机 文件 等 。 

(3) 数据 独立 性 低 

文件 系统 只 实现 了 数据 的 物理 独立 性 ,而 没有 实现 数据 的 逻辑 独立 性 。 文 件 系统 中 的 
文件 是 为 某 一 特定 应 用 服务 的 ,文件 的 逻辑 结构 对 某 应 用 程序 来 说 是 优化 的 ,因此 要 想 再 增 
加 一 些 新 的 应 用 会 很 困难 ,系统 不 容易 扩充 ,一 旦 数据 的 逻辑 结构 改变 ,必须 修改 应 用 程序 ， 
修改 文件 结构 的 定义 。 而 应 用 程序 的 改变 ,如 改 用 不 同 的 高 级 语言 等 ,也 将 引起 文件 数据 结 
构 的 改变 ,因此 数据 与 程序 之 间 仍 缺乏 独立 性 。 

(4) 数据 共享 性 差 

在 文件 系统 中 ,一 个 文件 基本 上 对 应 于 一 个 应 用 程序 , 即 文件 仍然 是 面向 应 用 的 ,如 
图 1-2 所 示 。 当 不 同 的 应 用 程序 具有 部 分 相同 的 数据 时 ,也 必须 建立 各 自 的 文件 ,而 不 能 共 
享 相同 的 数据 ,因此 数据 的 元 余 度 大 ,同时 ,重复 存储 也 容易 造成 数据 的 不 一 致 性 。 


应 用 程序 2 数据 集 2 


应 用 程序 n 数据 集 n 


图 1-2 文件 管理 阶段 程序 与 数据 的 对 应 关系 


3. 数据 库 系统 阶段 


20 世纪 60 年 代 后 期 以 来 ,计算 机 用 于 管理 的 规模 越 来 越 庞大 ,应 用 越 来 越 广泛 ,数据 
量 急 剧 增长 ,同时 ,多 种 应 用 、 多 种 语言 互相 覆盖 地 共享 数据 集合 的 要 求 越 来 越 强烈 ,计算 机 
管理 进入 到 数据 库 系统 阶段 。 此 时 硬件 已 有 大 容量 磁盘 ,硬件 价格 下 降 , 软 件 价 格 上 升 ,为 
编制 和 维护 系统 软件 及 应 用 程序 所 需 的 成 本 相对 增加 ; 在 处 理 方式 上 ,联机 实时 处 理 的 要 
求 更 多 ,并 开始 提出 和 考虑 分 布 处 理 。 在 这 种 背景 下 ,出 现 了 数据 库 技术 ,由 统一 的 专门 软 
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件 系统 一 数据 库 管理 系统 来 管理 数据 。 
用 数据 库 系 统 来 管理 数据 具有 如 下 特点 。 

(1) 数据 结构 化 

数据 结构 化 是 数据 库 系 统 与 文件 系统 的 根本 区 别 。 

在 文件 系统 中 ,相互 独立 的 文件 的 记录 内 部 是 有 结构 的 。 但 数据 文件 之 间 无 联系 ,数据 
是 面向 具体 应 用 的 ,没有 灵活 性 。 而 数据 库 系统 在 描述 数据 时 不 仅 描述 数据 本 身 , 还 描述 数 
据 之 间 的 联系 ,能 够 展现 整体 数据 的 结构 化 。 这 是 数据 库 的 主要 特征 之 一 ,也 是 数据 库 系统 
与 文件 系统 的 本 质 区 别 。 

在 数据 库 系 统 中 ,不 仅 数据 是 结构 化 的 ,而 且 存 取 数 据 的 方式 也 很 灵活 ,可 以 存 取 数据 
库 中 的 某 一 个 数据 项 一 组 数据 项 一 个 记录 或 一 组 记录 。 而 在 文件 系统 中 ,数据 的 最 小 存 
取 单 位 是 记录 ,其 粒度 不 能 细 到 数据 项 。 

(2) 数据 独立 性 高 

数据 库 系统 中 的 数据 既 具 有 物理 独立 性 ,又 具有 逻辑 独立 性 。 逻 辑 独 立 性 保证 了 当 数 
据 的 总 体 罗 辑 结构 改变 时 ,应 用 程序 不 必修 改 ; 物理 独立 性 保证 了 当 数 据 的 存储 结构 ( 即 物 
理 结构 ) 改 变 时 ,可 以 保持 数据 的 逻辑 结构 不 变 ,从 而 应 用 程序 也 不 必 改 变 。 

数据 与 程序 之 间 的 独立 性 ,使 得 可 以 把 数据 的 定义 和 描述 从 应 用 程序 中 分 离 出 去 ; 大 
大 减少 了 应 用 程序 的 维护 和 修改 工作 。 

(3) 数据 的 共享 性 好 ,元 余 度 低 

数据 的 共享 程度 直接 关系 到 数据 的 元 余 度 。 数 据 库 系统 从 整体 角度 看 待 和 描述 数据 ， 
数据 不 再 面向 某 个 应 用 而 是 面向 整个 系统 ,如 图 1-3 所 示 。 这 样 既 可 以 大 大 减少 数据 元 余 ， 
节约 存储 空间 ,又 能 够 避免 数据 之 间 的 不 相 容 性 与 不 一 致 性 。 


应 用 程序 1 


应 用 程序 2 


应 用 程序 


图 1-3 数据 库 系 统 阶段 程序 与 数据 的 对 应 关系 


(4) 数据 由 数据 库 管理 系统 统一 管理 和 控制 

由 于 对 数据 实行 了 统一 的 管理 ,而 且 所 管理 的 是 有 结构 的 数据 ,因此 在 使 用 数据 时 可 以 
有 很 灵活 的 方式 。 同 时 ,除了 管理 功能 以 外 ,数据 库 管理 系统 还 能 够 保证 数据 的 安全 性 、 完 
整 性 ,进行 并 发 控制 和 数据 库 恢复 。 

由 于 数据 库 面向 日 常事 务 处 理 , 不 适合 进行 分 析 人 处理 ,一 种 新 的 技术 应 运 而 生 , 这 就 是 
数据 仓库 技术 。 数 据 仓库 技术 是 公认 的 有 利于 信息 利用 的 最 佳 解决 方案 , 它 不 仅 能 从 容 
解决 信息 技术 人 员 面 临 的 问题 ,同时 也 为 商业 用 户 提供 了 很 好 的 商业 契机 。 数 据 仓 库 已 成 
为 建立 现代 决策 支持 系统 的 重要 技术 手段 。 关 于 数据 仓库 的 具体 内 容 将 在 第 10 章 详细 
介绍 。 
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(2 数据 库 管理 系统 


1.2.1 数据 库 管理 系统 的 定义 


数据 库 , 可 以 直观 地 理解 为 存放 数据 的 仓库 ,只 不 过 这 个 仓库 位 于 计算 机 的 大 容量 存储 
器 上 ,数据 不 仅 要 按 一 定 的 格式 存放 ,还 要 便于 查找 。 因 此 ,所 谓 数据 库 就 是 长 期 存储 在 计 
算 机 内 、 有 组 织 的 、 可 共享 的 数据 集合 。 数 据 库 中 的 数据 按 一 定 的 数据 模型 组 织 、 描 述 和 存 
储 , 具 有 较 小 的 宛 余 度 、 较 高 的 数据 独立 性 和 易 扩 展 性 ,并 可 为 各 种 用 户 共享 。 

了 解 了 数据 库 和 数据 库 系 统 的 概念 ,就 应 该 研究 如 何 利 用 计算 机 有 效 地 组 织 和 存储 数 
据 、 获 取 和 管理 数据 ,完成 这 个 任务 的 是 数据 库 管理 系统 。 

数据 库 管理 系统 (Database Management System ,DBMS) 是 位 于 用 户 和 操作 系统 之 间 
的 一 层 数 据 管 理 软件 , 它 使 用 户 能 方便 地 定义 数据 和 操纵 数据 ,并 能 够 保证 数据 的 安全 性 、 
完整 性 ,多 用 户 并 发 使 用 及 发 生 故 障 后 的 系统 恢复 。 


1.2.2 ”数据库 管理 系统 的 功能 


数据 库 管 理 系统 是 用 于 建立 ,使 用 和 维护 数据 库 的 一 组 软件 ,目前 常用 的 DBMS 有 
SQL Server、Oracle、MySQL .Sybase 等。 只 有 在 计算 机 上 配置 了 DBMS 之 后 ,才能 建立 所 
需要 的 数据 库 。 

DBMS 的 主要 功能 如 下 。 


1. 数据 定义 功能 


DBMS 提供 数据 定义 语言 (Data Definition Language.DDL) ,用户 通过 它 可 以 对 数据 库 
的 结构 进行 描述 ,包括 模式 、 外 模式 、 内 模式 的 定义 (具体 应 用 时 如 数据 库 、 基 本 表 、 视 图 、 索 
引 ) ,数据 库 的 完整 性 定义 ,安全 保密 定义 等 。 这 些 定义 存储 在 数据 字典 中 ,是 DBMS 运行 
的 基本 依据 。 


2. 数据 操纵 功能 


DBMS 提供 数据 操纵 语言 (Data Manipulation Language,DML) ,实现 对 数据 库 中 数据 
的 基本 操作 ,如 查询 .插入 、 删 除 和 修改 。DML 分 为 两 类 : 宿主 型 和 自 含 型 。 所 谓 宿主 型 是 
指 将 DML 语句 嵌入 到 某 种 主语 言 中 使 用 ; 自 含 型 是 指 可 以 单独 使 用 DML 语句 ,供用 户 交 
互 使 


3. 数据 库 的 运行 管理 


这 是 DBMS 的 核心 部 分 ,所 有 数据 库 的 操作 都 要 在 这 些 控制 程序 的 统一 管理 下 进行 。 
数据 库 的 运行 管理 包括 数据 库 在 运行 期 间 多 用 户 环境 下 的 并 发 控制 ( 即 处 理 多 个 用 户 同时 
使 用 某 些 数据 可 能 产生 的 问题 ) 安全 性 检查 .完整 性 约束 条 件 的 检查 和 执行 .运行 日 志 的 组 
织 管理 和 数据 库 内 部 维护 等 。 
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4. 数据 库 的 建立 和 维护 功能 


数据 库 的 建立 和 维护 是 DBMS 的 一 个 重要 组 成 部 分 , 它 包 括 数 据 库 初始 数据 的 输入 、 
数据 转换 ,数据库 的 转 储 ,恢复 功能 ,数据 库 的 重新 组 织 功能 和 性 能 监视 ,分 析 功 能 等 ,这 些 
功能 通常 是 由 一 些 实用 程序 完成 的 。 

5. 数据 组 织 ,存储 和 管理 

数据 库 中 需要 存放 多 种 数据 ,如 数据 字典 、 用 户 数 据 、 存 取 路 径 等 。DBMS 负责 分 门 别 
类 地 组 织 、 存 储 和 管理 这 些 数据 ,确定 以 何 种 文件 结构 和 存 取 方式 物理 地 组 织 这 些 数据 ,如 


何 实现 数据 之 间 的 联系 ,以 便 提高 存储 空间 利用 率 以 及 提高 随机 查找 .顺序 查找 、 增 、 删 、 改 
等 操作 的 效率 。 


6. 数据 通信 功能 


DBMS 提供 与 其 他 软件 系统 进行 通信 的 功能 ,例如 与 操作 系统 的 联机 处 理 、 分 时 处 理 
和 远程 作业 传输 的 相应 接口 ,又 如 与 其 他 DBMS 或 文件 系统 的 接口 ,从 而 能 够 将 该 DBMS 
下 的 数据 转换 为 其 他 DBMS 或 文件 系统 能 够 识别 的 数据 或 者 能 够 接收 男 一 个 DBMS 或 文 
件 系统 的 数据 。 


(3 数据 库 系统 


1.3.1 数据 库 系统 的 定义 


数据 库 本 身 不 是 独立 存在 的 , 它 是 数据 库 系 统 的 一 部 分 ,在 实际 应 用 中 ,人 们 所 面 对 的 
数据 库 系统 (Database System,DBS) 是 指 带 有 数据 库 的 计算 机 应 用 系统 。 


1.3.2 数据 库 系 统 的 组 成 


数据 库 系 统 是 计算 机 应 用 系统 中 引入 数据 库 后 的 系统 。 简 单 地 讲 , 是 由 硬件 、 软 件 、 数 
据 库 和 人 员 组 成 的 : 具体 来 讲 ,一 般 由 硬件 系统 、 数 据 库 管理 系统 及 相关 软件 、 数 据 库 集合 
和 人 员 组 成 (如 图 1-4 所 示 )。 

硬件 系统 是 整个 数据 库 系 统 的 基础 ,需要 有 足够 大 的 内 存 . 足 够 大 容量 的 磁盘 等 联机 直 
接 存 取 设备 等 ; 数据 库 管理 系统 是 管理 数据 库 的 软件 ,实现 数据 库 的 建立 .使 用 和 维护 等 功 
能 , 它 是 数据 库 系 统 的 核心 ,相关 软件 是 支持 软件 (如 操作 系统 .语言 编译 系统 .应 用 程序 
等 ); 数据 库 集合 是 相关 数据 的 集合 ,是 若干 个 设计 合理 ,满足 应 用 需要 的 数据 库 ; 人 员 主 
要 包括 数据 库 管理 员 、 系 统 分 析 员 程序 员 和 用 户 , 其 中 数据 库 管理 员 是 对 DBMS 直接 进行 
操作 的 人 员 ,其 作用 非常 重要 。 

数据 库 管 理 员 (Database Administrator, DBA ) 是 一 个 或 一 组 人 员 , 是 全 面 负责 数据 库 
的 建立 ,维护 和 管理 数据 库 系 统 的 人 员 ,其 具体 的 职责 包括 : 

。 设计 与 定义 数据 库 系 统 。 数 据 库 中 要 存放 哪些 数据 ,是 由 系统 需求 来 决定 的 。 为 了 
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更 好 地 对 数据 库 系 统 进行 有 效 的 管理 和 维护 ,DBA 应 该 参加 、 了 解数 据 库 建设 的 全 
过 程 ,并 与 系统 分 析 员 ,程序 员 和 用 户 共同 协商 , 搞 好 数据 库 设 计 , 并 决定 数据 库 的 
存储 结构 和 存 取 策略 ,以 获得 较 高 的 存 取 效率 和 存储 空间 利用 率 。 

监控 数据 库 的 使 用 和 运行 。DBA 负责 监视 数据 库 系 统 的 运行 情况 ,及 时 处 理 运 行 
过 程 中 出 现 的 问题 ,定义 数据 的 安全 性 要 求 和 完整 性 约束 条 件 ,收集 系统 审计 信息 。 
数据 库 的 转 储 与 恢复 。 当 数据 库 系统 发 生 故 障 时 ,数据 库 中 的 数据 可 能 会 遭 到 不 同 
程度 的 破坏 ,DBA 必须 在 最 短 的 时 间 内 将 数据 库 中 的 数据 恢复 到 某 种 一 致 状态 。 
为 此 ,DBA 要 定义 和 实施 适当 的 后 援 和 恢复 策略 ,如 周期 性 地 转 储 数据 和 维护 日 志 
文件 等 。 

数据 库 的 改进 和 重组 。DBA 还 负责 监视 和 分 析 系 统 运行 期 间 的 性 能 (如 处 理 效 
率 ), 对 运行 情况 进行 记录 ,统计 分 析 , 依 靠 工作 实践 并 根据 实际 应 用 环境 不 断 改进 
数据 库 设计 。 同 时 ,在 数据 库 运 行 过 程 中 ,大 量 数据 不 断 被 增 、 删 \ 改 , 随 着 运行 时 间 
的 延长 ,可 能 会 影响 系统 的 性 能 ,因此 需要 DBA 定期 对 数据 库 进 行 重新 组 织 。 
数据 库 的 重 构 。 当 用 户 的 需求 增加 或 改变 时 ,DBA 还 要 对 数据 库 进 行 较 大 的 改造 ， 
包括 增加 和 修改 部 分 设计 。 


图 1-4 数据 库 系统 的 组 成 


1.3.3 数据 库 系统 的 模式 


当 设计 数据 库 时 ,人 们 对 数据 库 的 结构 感 兴趣 ; 当 应 用 数据 库 时 ,人 们 关心 的 是 数据 库 
中 的 数据 。 数 据 库 中 的 数据 经 常 变化 ,而 数据 库 的 结构 在 一 定时 间 范 围 内 不 会 改变 。 

在 数据 模型 中 有 “型 "和 “ 值 ” 的 概念 : 型 是 指 对 某 一 类 数据 的 结 拘 和 属性 的 说 明 , 即 数 
据 库 的 结构 ; 值 是 型 的 一 个 具体 赋值 , 即 数据 库 中 的 具体 数据 。 

数据 库 中 结构 的 定义 可 以 在 多 个 抽象 级 别 上 进行 ,形成 多 个 级 别 的 数据 库 模 式 。 模 式 
是 数据 库 中 全 体 数 据 的 逻辑 结构 和 特征 的 描述 , 它 仅仅 涉及 型 的 描述 ,不 涉及 具体 的 值 。 模 
式 的 一 个 具体 值 称 为 模式 的 一 个 实例 。 同 一 个 模式 可 以 有 很 多 个 实例 。 模 式 是 相对 稳定 
的 ,而 实例 是 相对 变动 的 。 模 式 反 映 的 是 数据 的 结构 及 其 关系 ,而 实例 反映 的 是 数据 库 在 某 
一 时 刻 的 状态 。 
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1. 数据 库 的 三 级 模式 结构 
图 1-5 说 明了 数据 库 系统 的 三 级 模式 : 外 模式 、 模 式 和 内 模式 。 


应 用 A | | 应 HB | | sme | [ ED | [sme | [ER 


Te 


外 模式 1 外 模式 2 外 模式 3 
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图 1-5 数据 库 系统 模式 结构 


(1) 模式 

模式 也 称 罗 辑 模式 或 概念 模式 ,是 对 数据 库 中 全 体 数 据 的 逻辑 结构 和 特征 的 描述 ,是 所 
有 用 户 的 公共 数据 视图 , 它 是 数据 库 系统 模式 结构 的 中 间 层 ,不 涉及 数据 的 物理 存储 细节 和 
硬件 环境 ,与 具体 的 应 用 程序 ,以 及 所 使 用 的 应 用 开发 工具 和 高 级 程序 设计 语言 无 关 。 

实际 上 模式 是 数据 库 数据 在 逻辑 级 上 的 视图 。 一 个 数据 库 只 有 一 个 模式 。 定 义 模式 时 
不 仅 要 定义 数据 的 逻辑 结构 ,而 且 要 定义 与 数据 有 关 的 安全 性 、 完 整 性 要 求 ,定义 这 些 数 据 
之 间 的 联系 。 

(2) 外 模式 

外 模式 也 称 子 模 式 或 用 户 模式 , 它 是 对 数据 库 用 户 ( 包 括 应 用 程序 员 和 最 终 用 户 ) 看 见 
和 使 用 的 局 部 数据 的 逻辑 结构 和 特征 的 描述 ,是 数据 库 用 户 的 数据 视图 ,是 与 某 一 应 用 有 关 
的 数据 的 逻辑 表示 。 

外 模式 通常 是 模式 的 子 集 。 一 个 数据 库 可 以 有 多 个 外 模式 。 即 使 是 模式 中 同一 数据 ， 
在 外 模式 中 的 结构 、 类 型 .长度 .保密 级 别 等 都 可 以 不 同 。 另 一 方面 ,同一 外 模式 也 可 以 为 某 
一 用 户 的 多 个 应 用 系统 所 使 用 ,但 一 个 应 用 程序 只 能 使 用 一 个 外 模式 。 

外 模式 是 保护 数据 库 安 全 性 的 一 个 有 力 措施 。 每 个 用 户 只 能 看 见 和 访问 所 对 应 的 外 模 
式 中 的 数据 ,数据 库 中 的 其 余数 据 对 他 们 来 说 是 不 可 见 的 。 

(3) 内 模式 

内 模式 也 称 存储 模式 , 它 是 对 数据 物理 结构 和 存储 结构 的 描述 ,是 数据 在 数据 库 内 部 的 
表示 方式 。 一 个 数据 库 只 有 一 个 内 模式 。 

图 1-6 是 关于 三 级 模式 的 示例 。 
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外 模式 1 外 模式 2 
V1( 图 书 编号 ,图 书 名 称 ) V2( 图 书 编号 ,图 书 名 称 ,类 别 ,出 版 社 ) 


模式 | Book(BNo, Title, Author, Category, Publisher, PublishDate) 


| 


struct BOOK 
fchar BNo[10]; 

char Title[40]; 

内 模式 char Author[20]; 
char Category[20]; 
char Publisher[40]; 
Date PublishDate; 

} 


图 1-6 数据 库 三 级 模式 示例 


2. 数据 库 的 两 级 映像 功能 


DBMS 为 实现 三 级 模式 结构 ,不 仅 提 供 了 定义 内 模式 、 模 式 、 外 模式 的 语言 ,而 且 还 在 
三 级 模式 之 间 提 供 了 两 级 映像 : 外 模式 /模式 映像 和 模式 /内 模式 映像 。 正 是 这 两 级 映像 保 
证 了 数据 库 系统 中 的 数据 具有 较 高 的 逻辑 独立 性 和 物理 独立 性 。 

(1) 外 模式 /模式 映像 

模式 描述 的 是 数据 的 全 局 逻辑 结构 ,外 模式 描述 的 是 数据 的 局 部 九 辑 结构 对 应 于 同一 
个 模式 可 以 有 任意 多 个 外 模式 。 对 于 每 一 个 外 模式 ,数据 库 系统 都 有 一 个 外 模式 /模式 映 
像 , 它 定义 了 该 外 模式 与 模式 之 间 的 对 应 关系 。 这 些 映 像 定 义 通常 包含 在 各 自 外 模式 的 描 
述 中 。 当 模式 改变 时 (如 增加 新 的 数据 类 型 .新 的 数据 项 、 新 的 关系 等 ), 由 数据 库 管 理 员 对 
数据 库 外 模式 /模式 映像 做 相应 的 改变 ,可 以 使 外 模式 保持 不 变 。 从 而 不 必修 改 应 用 程序 ， 
保证 了 数据 的 迎 辑 独立 性 。 

(2) 模式 /内 模式 映像 

数据 库 中 只 有 一 个 模式 ,也 只 有 一 个 内 模式 ,所 以 模式 /内 模式 映像 是 唯一 的 , 它 定义 了 
数据 全 局 逻辑 结构 与 存储 结构 之 间 的 对 应 关系 。 例 如 ,说 明 逻 辑 记录 和 字段 在 数据 库 内 部 
是 如 何 表示 的 。 该 映像 定义 通常 包含 在 模式 描述 中 。 当 数据 库 的 存储 结构 发 生 改变 时 ( 例 
如 ,采用 了 更 先进 的 存储 结构 ) ,由 数据 库 管 理 员 对 模式 /内 模式 映像 做 相应 的 改变 ,可 以 使 
模式 保持 不 变 , 从 而 保证 了 数据 的 物理 独立 性 。 

数据 独立 性 是 数据 库 系统 追求 的 目标 。DBMS 实现 的 三 级 模式 和 二 级 映像 机 制 , 使 得 
数据 库 系 统 具 有 较 强 的 逻辑 独立 性 和 物理 独立 性 。 因 为 特定 的 应 用 程序 是 在 外 模式 描述 的 
数据 结构 的 基础 上 编写 的 .依赖 于 特定 的 外 模式 ,但 独立 于 数据 库 的 模式 和 存储 结构 。 数 据 
库 的 二 级 映像 保证 了 数据 库 外 模式 的 稳定 性 ,从 而 从 底层 保证 了 应 用 程序 的 稳定 性 。 另 一 
方面 ,数据 与 应 用 程序 的 独立 性 ,使 得 数据 的 定义 和 描述 可 以 从 应 用 程序 中 分 离 出 去 。 而 
且 , 由 于 数据 的 存 取 和 存储 由 DBMS 管理 .用 户 不 必 考 虑 存 取 路 径 等 细节 ,因此 简化 了 应 
程序 的 编制 ,减少 了 应 用 程序 的 维护 与 修改 工作 ,提高 了 应 用 程序 的 质量 。 


数据 库 语 言 包括 数据 描述 语言 .数据 操纵 语言 、 数 据 控制 语言 和 宿主 语言 。 
1. 数据 描述 语言 


数据 描述 语言 (CDDL) 用 于 描述 数据 库 中 各 种 对 象 的 特征 ,主要 描述 数据 的 逻辑 结构 、 
数据 的 物理 特征 、 催 辑 数据 到 物理 数据 的 映射 (通常 称 为 存储 映射 ) 和 访问 规则 (如 用 户 与 外 
模式 的 对 应 关系 、 用 户 身份 确认 等 )。 

数据 库 三 级 模式 均 使 用 DDL 来 描述 ,只 是 内 模式 由 内 模式 DDL 定义 ,而 物理 数据 库 的 
详细 设计 由 DBMS 的 设备 介质 语言 来 定义 。 


2. 数据 操纵 语言 


数据 操纵 语言 (DML) ,是 用 户 与 数据 库 系 统 的 接口 之 一 ,是 用 户 操作 数据 库 中 数据 的 
工具 。 使 用 DML 可 以 实现 数据 库 数 据 的 插入 、 删 除 、 修 改 、 查 询 、 统 计 等 操作 。 在 设计 
DML 时 ,一般 要 做 到 描述 操作 准确 ,无 二 义 性 ; 功能 齐全 ,操作 能 力 强 。 用 户 希 望 使 用 的 操 
作 应 尽量 满足 语言 自然 .直观 ,容易 掌握 ,使 用 方便 等 要 求 。 


3. 数据 控制 语言 


数据 控制 语言 (Data Control Language,DCL) ,是 数据 库 中 实现 数据 访问 权限 控制 以 及 
事务 管理 的 一 类 语言 。 例 如 ,限制 用 户 对 某 类 数据 的 插入 、 删 除 、 修 改 、 查 询 等 操作 ,或 取消 
一 些 限制 , 当 数 据 库 操作 完成 时 提交 事务 或 回 深 事 务 等。 对 数据 库 对 象 进行 操作 的 授权 工 
作 一 般 由 数据 对 象 创建 者 或 数据 库 管理 员 完 成 。 


4. 宿主 语言 


宿主 语言 是 通常 的 程序 设计 语言 (如 C 语言 )。 数 据 库 上 的 操作 常用 应 用 程序 实现 ,而 
且 应 用 程序 还 要 完成 许多 非 数据 库 上 的 操作 ,因此 操作 数据 库 的 程序 一 般 用 宿主 语言 写成 。 

宿主 语言 可 以 通过 两 种 方式 引用 DML 的 命令 : 

。 通过 DBMS 提供 的 过 程 (或 函数 ) 引 用 。 

。 将 DML 嵌入 宿主 语言 中 ,与 宿主 语言 一 起 使 用 。 

第 二 种 方式 可 能 有 一 个 预 编译 器 处 理 DML, 或 有 一 个 编译 器 既 能 处 理 宿主 语言 又 能 处 
理 DML, 并 将 DML 语句 转换 成 调用 DBMS 提供 的 过 程 (或 函数 ) 。 


(4 数据 模型 


数据 库 中 的 数据 是 有 结构 的 , 即 不 仅 包含 数据 本 身 的 内 容 , 还 包含 数据 之 间 的 关系 。 因 
为 计算 机 不 可 能 直接 处 理 现实 世界 中 的 具体 事物 ,所 以 必须 事先 把 具体 事物 转换 成 计算 机 
能 够 处 理 的 数据 。 在 数据 库 中 ,是 利用 数据 模型 这 个 工具 来 抽象 、 表 示 和 处 理 现实 世界 中 的 
数据 和 信息 的 。 
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1.4.1 数据 处 理 的 三 个 领域 


数据 从 现实 世界 到 数据 库 里 的 具体 表示 要 经 历 三 个 领域 , 即 现实 世界 、 信 息 世 界 、 计 算 
机 世界 。 这 三 个 领域 的 关系 如 图 1-7 所 示 。 


1. 现实 世界 现实 世界 

现实 世界 是 指 客观 存在 世界 中 的 事物 及 联系 ,是 存 收集、 分 类 和 抽象 
在 于 人 们 头脑 之 外 的 客观 世界 。 现 实 世 界 的 数据 就 是 客 信息 世界 (E-R 表 示 ) 
观 存在 的 各 种 报表 ,图标 和 查询 格式 等 原始 数据 。 计 算 | 和 


机 要 能 处 理 数据 ,首先 要 解决 的 问题 就 是 按 用 户 的 观点 [IERDRNISIROR 
对 数据 和 信息 建 模 , 即 抽取 数据 库 技术 所 研究 的 数据 , 然 


后 分 门 别 类 ,综合 出 系统 所 需要 的 数据 。 图 7， 歼 据 处 理 的 三 个 领域 
2. 信息 世界 


信息 世界 (或 称 概念 世界 ) 是 现实 世界 在 人 们 头脑 中 的 反映 ,是 对 客观 事物 及 其 联系 的 
一 种 抽象 描述 。 人 们 用 符号 .文字 将 数据 记录 下 来 。 在 信息 世界 中 ,一 般 使 用 实体 -联系 
(Entity-Relationship,E-R) 图 表示 概念 数据 模型 。 

信息 世界 涉及 以 下 主要 概念 。 

(1) 实体 

实体 (Entity) 是 现实 世界 中 客观 存在 并 可 相互 区 分 的 事件 或 物体 。 例 如 ,一 本 书 、 一 个 
学 生 , 一 间 教 室 等 都 是 实体 。 实 体 可 以 是 具体 的 人 .、 事 、 物 ,也 可 以 是 抽象 的 概念 或 联系 。 

同类 型 实体 的 集合 称 为 实体 集 。 

(2) 属性 

实体 所 具有 的 某 一 特性 称 为 属性 (Attribute) 。 实 体 都 是 由 一 组 属性 来 表示 的 ,如 某 网 
站 会 员 可 以 用 (用 户 名 ,密码 ,性 别 , 出 生日 期 …) 来 描述 。 属 性 的 具体 取 值 称 为 属性 值 , 用 以 
表示 一 个 具体 的 实体 。 

(3) 码 

可 以 唯一 标识 实体 的 属性 称 为 码 (Key)。 例 如 ,图 书 的 码 为 图 书 编号 。 

(4) 域 

属性 的 取 值 范围 称 为 该 属性 的 域 (Domain)。 例 如 ,图 书 名 称 和 作者 的 域 为 字符 串 集 
合 ,会 员 性 别 的 域 为 ( 男 , 女 ) ,出 生日 期 的 域 为 日 期 。 

(5) 实体 集 

实体 集 (Entity Set) 是 具有 相同 属性 的 实体 集合 。 例 如 ,图 书馆 中 所 有 供 借阅 的 图 书 就 
是 一 个 图 书 的 实体 集 。 

(6) 实体 型 

实体 型 (Entity Type) 是 对 实体 集 的 抽象 描述 ,用 实体 名 及 其 属性 名 集合 来 抽象 和 刻画 
同类 实体 ,例如 图 书 (编号 , 书 名 、 作 者 类别、 出 版 社 、 出 版 时 间 )。 

(7) 联系 

在 现实 世界 中 ,事物 内 部 以 及 事物 之 间 是 有 联系 的 ,这 些 联系 在 信息 世界 中 反映 为 实体 
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内 部 的 联系 (Relationship) 和 实体 之 间 的 联系 。 实 体内 部 的 联系 反映 数据 在 同一 个 实体 内 
各 属性 之 间 的 联系 。 

@ 两 个 实体 之 间 的 联系 

。 一 对 一 联系 (1: 1) 

如 果 对 于 实体 集 A 中 的 每 一 个 实体 ,实体 集 B 中 至 多 有 一 个 实体 与 之 联系 ,反之 亦 然 ， 
则 称 实体 集 A 与 实体 集 B 具有 一 对 一 联系 , 记 为 1: 1。 

例如 ,公司 里 面 ,一 个 部 门 只 有 一 个 经 理 , 而 一 个 经 理 只 在 一 个 部 门 中 任职 , 则 部 门 集 与 
经 理 集 之 间 的 联系 为 1 : 1。 
。 一 对 多 联系 (1 : n) 
如 果 对 于 实体 集 A 中 的 每 一 个 实体 ,实体 集 B 中 有 n(n 宇 0) 个 实体 与 之 联系 ; 对 于 实 
体 集 B 中 的 每 一 个 实体 ,实体 集 A 中 至 多 有 一 个 实体 与 之 联系 , 则 称 实体 集 A 与 实体 集 B 
具有 一 对 多 联系 , 记 为 1 : n。 
例如 ,一 个 部 门 有 多 个 职工 ,而 一 个 职工 上 只 在 一 个 部 门 工 作 , 则 部 门 集 与 职工 集 之 间 的 
联系 为 1 : 7。 
。 多 对 多 联系 (m : n) 
如 果 对 于 实体 集 A 中 的 每 一 个 实体 ,实体 集 B 中 有 n(n 宇 0) 个 实体 与 之 联系 ; 对 于 实 
体 集 B 中 的 每 一 个 实体 ,实体 集 A 中 有 mCm 宇 0) 个 实体 与 之 联系 , 则 称 实体 集 A 与 实体 集 
B 具有 多 对 多 联系 , 记 为 m : ms 
例如 ,一 个 产品 可 以 由 多 个 零件 组 成 ,而 一 个 零件 又 可 以 用 于 多 种 产品 , 则 产品 集 与 零 
件 集 之 间 的 联系 为 m : n。 
对 信息 世界 建 模 ,必须 方便 、 准 确 地 表示 出 上 述 信息 世界 中 的 常用 概念 ,最 常用 的 工 
有 具 是 实体 -联系 图 (E-R 图 )。E-R 图 提供 以 下 描述 实体 型 .属性 和 联系 的 方法 (如 图 1-8 
所 示 ) 。 
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图 1-8 ER 图 示例 


实体 型 : 用 矩形 表示 ,矩形 框 内 写 明 实体 名 。 

属性 : 用 椭圆 形 表示 ,并 用 无 向 边 将 其 与 相应 的 实体 连接 起 来 。 

联系 : 用 萎 形 表示 ,菱形 框 内 写 明 联系 名 ,并 用 无 向 边 分 别 与 有 关 实 体型 连接 起 来 , 同 
时 在 无 向 边 旁 标 上 联系 的 类 型 。 注 意 : 联系 本 身 也 是 一 种 实体 型 ,也 可 以 有 属性 ,联系 的 属 
性 也 要 用 无 向 边 与 该 联系 连接 起 来 。 

两 个 实体 间 的 三 种 联系 ,可 以 用 图 1-9 表示 。 

当 实 体 及 联系 较 多 时 ,可 以 将 ER 图 分 成 两 部 分 : 实体 及 属性 图 和 实体 及 联系 图 (如 
图 1-10 所 示 ) 。 
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图 1-9 两 个 实体 间 的 三 种 联系 
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PROJECT PART 
(a) 实体 及 属性 图 
CP# CNAMB 
PROJECT PART 全 <Cs > SUPPLIER 
a a Emery 
(b) 实体 及 联系 图 


图 1-10 E-R 图 示例 


@ 一 个 实体 内 的 联系 

一 个 实体 内 的 联系 也 包括 1:1、1: nm :nn 三 种 。 例 如 ,学 生 实 
体型 内 部 具有 领导 和 被 领导 的 联系 , 即 班长 领导 班 里 的 学 生 ,而 每 个 

生 只 被 一 个 班长 领导 ,如 图 1-11 所 示 。 

@ 多 个 实体 间 的 联系 

多 个 实体 间 的 联系 也 包括 1: :nvm :nn 三 种 。 例 如 ,教师 、 
课程 和 学 生 三 part bet 每 个 教师 可 以 讲授 多 门 
课程 给 不 同 的 学 生 ,每 门 课程 可 能 会 有 多 个 教师 讲授 ,每 个 学 生 可 以 上 多 门 课程 ,每 门 课程 
都 有 很 多 学 生 选 修 , 所 以 他 们 之 间 是 多 对 多 的 联系 。 又 如 ,每 个 保管 员工 作 在 一 个 仓库 中 ， 
保管 着 多 种 商品 ,每 种 商品 只 能 存放 在 一 个 仓库 中 ,每 个 仓库 由 多 名 保管 员 看 管 。 以 上 两 个 
例子 中 多 个 实体 间 的 联系 如 图 1-12 所 示 。 


图 1-11 一 个 实体 内 的 
联系 示例 


教师 保管 员 
m m] 
nn > 1 1 保管 n 
课程 学 生 | | 全 库 | 商品 


图 1-12 三 个 实体 间 的 联系 示例 
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3. 计算 机 世界 


计算 机 世界 也 可 称 做 数据 世界 或 机 器 世界 ,是 在 信息 世界 基础 上 的 进一步 抽象 ,表现 为 
DBMS 支持 的 数据 模型 。 


1.4.2 数据 模型 的 要 素 


数据 模型 是 对 客观 事物 及 其 联系 的 数据 描述 ,需要 描述 系统 的 静态 特性 、 动 态 特性 和 约 
束 条 件 。 


1. 数据 结构 


数据 结构 用 于 描述 系统 的 静态 特性 。 

数据 结构 是 所 研究 的 对 象 类 型 的 集合 。 这 些 对 象 是 数据 库 的 组 成 成 分 ,包括 两 类 : 一 
类 是 与 数据 类 型 .内容 性质 有 关 的 对 象 ; 男 一 类 是 与 数据 之 间 联 系 有 关 的 对 象 。 

数据 结构 是 刻画 一 个 数据 模型 性 质 最 重要 的 方面 。 因 此 在 数据 库 系统 中 ,通常 按照 其 
数据 结构 的 类 型 来 命名 数据 模型 。 


2. 数据 操作 


数据 操作 用 于 描述 系统 的 动态 特性 。 

数据 操作 是 指 对 数据 库 中 各 种 对 象 的 实例 允许 执行 的 操作 的 集合 ,包括 操作 及 有 关 的 
操作 规则 。 数 据 库 主要 有 检索 和 更 新 (插入 、 删 除 , 修 改 ) 两 大 类 操作 。 数 据 模型 必须 定义 这 
些 操作 的 确切 含义 、 操 作 符号 、 操 作 规 则 (如 优先 级 ) 以 及 实现 操作 的 语言 。 


3. 数据 的 约束 条 件 


数据 的 约束 条 件 是 一 组 完整 性 规则 的 集合 ; 完整 性 规则 是 给 定 的 数据 模型 中 数据 及 其 
联系 所 具有 的 制约 和 存储 规则 ,用 以 限定 符合 数据 模型 的 数据 库 状态 以 及 状态 的 变化 ,以 保 
证 数据 的 正确 有 效 和 相 容 。 

数据 模型 应 该 反映 和 规定 数据 模型 必须 遵守 的 基本 的 通用 的 完整 性 约束 条 件 , 此 外 还 
应 该 提供 定义 完整 性 约束 条 件 的 机 制 ,以 反映 具体 应 用 所 涉及 的 数据 。 


1.4.3 数据 模型 的 分 类 


按照 数据 模型 描述 角度 的 不 同 ,数据 模型 可 以 分 为 以 下 几 类 。 

。 概念 模型 : 也 称 信息 模型 , 按 用 户 的 观点 对 数据 和 信息 进行 建 模 , 是 现实 世界 到 信 
息 世 界 的 第 一 层 抽象 ,强调 其 语义 表达 功能 ,易于 用 户 理 解 ,是 用 户 和 数据 库 设 计 人 
员 交 流 的 语言 ,主要 用 于 数据 库 设计 。 在 这 类 模型 中 ,最 著名 的 工具 是 实体 联系 模 
型 (E-R 模型 ) ,前 面 已 详细 介绍 。 

数据 库 支持 的 数据 模型 : 它 是 按 计算 机 系统 的 观点 对 数据 进行 建 模 , 是 现实 世界 数 
据 特 征 的 抽象 ,用 于 实现 DBMS。 不 同 的 数据 模型 具有 不 同 的 数据 结构 形式 ,目前 
最 常用 的 数据 模型 有 层次 模型 ,网 状 模型 和 关系 模型 。 随 着 技术 发 展 ,面向 对 象 模 
型 越 来 越 受 到 关注 。 
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层次 模型 和 网 状 模型 统称 为 非 关系 模型 。 在 非 关系 模型 中 ,实体 用 记录 表示 ,实体 之 间 
的 联系 转换 成 记录 之 间 的 两 两 联系 。 非 关系 模型 数据 结构 的 基本 单 
位 是 基本 层次 联系 。 所 谓 基 本 层次 联系 是 指 两 个 记录 以 及 它们 之 间 的 
一 对 多 (包括 一 对 一 ) 的 联系 ,如 图 1-13 所 示 。 图 1-13 中 ,R; 位 于 联系 
廊 的 始点 , 称 为 双亲 结 点 ; 玉 位 于 联系 Li 的 终点 , 称 为 子女 结 点 。 

这 三 种 模型 的 根本 区 别 在 于 数据 之 间 联 系 的 方式 ( 即 记录 型 之 
间 的 联系 方式 ) 不 同 。 关 系 模型 是 用 “二 维 表 ” 来 表示 数据 之 间 的 关 
系 ; 层次 模型 是 用 * 树 结构 "来 表示 数据 之 间 的 关系 ; 网 状 模 型 是 用 “图 结构 "来 表示 数据 之 
间 的 关系 。 由 于 它们 的 数据 表示 方式 不 同 , 当 用 户 使 用 数据 库 时 ,关系 模型 只 用 了 数据 记录 
的 内 容 ,使 得 用 户 在 关系 DBMS 中 操作 时 ,不 必 去 了 解数 据 记录 的 联系 及 顺序 ,自然 就 觉得 使 
用 起 来 简单 方便 ; 而 层次 模型 和 网 状 模型 要 用 记录 与 记录 之 间 的 联系 ,以 及 它们 在 存储 结构 
中 的 具体 安排 ,这 就 要 求 用 户 有 较 多 的 计算 机 知识 ,对 一 般 用 户 来 说 ,使 用 起 来 就 不 太 简 单方 
便 了 。 下 面 对 这 三 种 模型 做 一 个 简单 的 介绍 。 


1-13 ”基本 层次 联系 


1. 层次 模型 


层次 模型 (Hierarchical Model) 是 数据 库 系统 中 最 早出 现 的 数据 模型 , 它 的 数据 结构 是 
一 棵 “有 向 树 ”, 即 采用 树 状 结构 表示 数据 与 数据 之 间 的 联系 。 层 次 模型 的 特征 是 : 

。 有 且 仅 有 一 个 结 点 没有 父 结 点 , 它 就 是 根 结 点 ; 

。 其 他 结 点 有 且 仅 有 一 个 父 结 点 。 

在 层次 模型 中 ,每 个 结 点 表示 一 个 实体 型 , 称 为 记录 型 。 一 个 记录 型 可 有 许多 记录 值 ， 
简称 为 记录 。 结 点 之 间 的 有 向 边 表示 记录 之 间 的 联系 。 如 果 要 存 取 某 一 记录 型 的 记录 ,可 
以 从 根 结 点 开始 ,按照 有 向 树 层 次 逐 层 向 下 查找 ,查找 路 径 就 是 存 取 路 径 。 

图 1-14 给 出 了 某 学 校 的 系 、 教 研 室 、 教 师 、 班 级 的 层次 模型 及 实例 。 图 1-14(a) 中 的 
“ 系 ? 是 根 结 点 ,该 树 状 结构 反映 的 是 实体 型 之 间 的 结构 。 该 模型 实际 存储 的 数据 通过 链接 


系 | 系 号 | 系 名 


] 

教研 室 | 室 号 | 宝 名 专业 | 专业 号 | 专业 名 
| 

教师 | 姓名 | 性 别 | 职称 | 年龄 班级 | 班 号 [名称 | 人 数 


(a) 


rr 
0 有 1 
FE es ; 
102 | 软件 |: 1001 | 软件 工程 | 
ES 人 和 ES a 
时 ses ' ! 
张 三 | 男 | 讲 顺 | 30 |: [oo IE 120 4; 


(b) 
图 1-14 层次 模型 示意 图 
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指针 体现 它们 之 间 的 这 种 联系 。 图 1-14(b) 的 实例 给 出 了 学 校 里 一 个 系 的 数据 ,其 他 系 的 
情况 用 虚线 框 表示 ,并 予以 省 略 。 

层次 模型 不 能 直接 表示 多 对 多 的 联系 。 若 要 表示 多 对 多 的 联系 ,可 采用 如 下 两 种 方法 。 

方法 1: 宛 余 结 点 法 。 将 两 个 实体 的 多 对 多 的 联系 转换 为 两 个 一 对 多 的 联系 。 

方法 2: 虚拟 结 点 分 解法 。 将 元 余 结 点 转换 为 虚拟 结 点 。 虚 拟 结 点 是 一 个 指引 元 ,指向 
所 代替 的 结 点 。 该 方法 的 优点 是 减少 对 储存 空间 的 浪费 ,避免 数据 的 不 一 致 性 ; 该 方法 的 
缺点 是 改变 储存 位 置 有 可 能 引起 虚拟 结 点 中 指针 的 修改 。 

层次 模型 的 特点 是 记录 之 间 的 联系 通过 指针 实现 ,比较 简单 ,查询 效率 高 。 

层次 模型 的 缺点 是 只 能 表示 1 : n 的 联系 ,尽管 有 许多 辅助 手段 可 以 实现 mw : nn 的 联 
系 , 但 较 复杂 ,不 易 掌 握 , 由 于 层次 顺序 严格 ,复杂 ,插入 删除 操作 的 限制 比较 多 ,导致 应 用 程 
序 编制 起 来 比较 复杂 。 


2. 网 状 模型 


用 网 状 结构 表示 实体 及 其 之 间 联 系 的 模型 称 为 网 状 模型 (Network Model) 。 网 状 模型 
(也 称 DBTG 模型 ) 是 一 个 比 层次 模型 更 具 普遍 性 的 数据 结构 ,是 层次 模型 的 一 个 特例 。 网 
状 模型 可 以 直接 描述 现实 世界 ,这 是 因为 去 掉 了 层次 模型 的 两 个 限制 ,网 状 模型 的 特征 是 ， 

。 可 以 有 一 个 以 上 的 结 点 没有 父 结 点 ; 

。 网 中 的 每 一 个 结 点 代表 一 个 记录 类 型 ,联系 用 链接 指针 来 实现 。 

广义 地 讲 ,任何 一 个 连通 的 基本 层次 联系 的 集合 都 是 网 状 模型 。 

图 1-15 给 出 了 一 个 简单 的 网 状 模 型 。 由 于 每 一 个 基本 层次 联系 都 代表 一 对 多 的 联系 ， 
因此 , 若 将 图 形 倒置 也 不 可 能 变 成 层次 模型 。 图 1-15(a) 中 的 每 一 个 结 点 为 一 个 记录 类 型 ， 
图 1-15(b) 是 图 1-15(a) 的 一 个 具体 示例 。 其 中 用 单 向 环形 链接 指针 实现 联系 。 可 以 看 出 ， 
如 果 零 件 和 配件 数量 较 多 ,链接 将 非常 复杂 。 


零件 


| 


配件 
(a) 


图 1-15 网 状 模型 示意 图 


网 状 模型 中 的 每 个 结 点 表示 一 个 记录 类 型 (实体 ), 每 个 记录 类 型 可 以 包含 若干 个 字段 
(实体 的 属性 ) , 结 点 间 的 连 线 表 示 记 录 类 型 之 间 一 对 多 的 联系 ,层次 模型 和 网 状 模型 的 主要 
区 别 如 下 : 

(1) 网 状 模型 中 ,子女 结 点 与 双亲 结 点 的 联系 不 唯一 ,因此 需要 为 每 个 联系 命名 ; 

(2) 网 状 模型 允许 复合 链 , 即 两 个 结 点 之 间 有 两 种 以 上 的 联系 ; 

(3) 网 状 模型 不 能 表示 记录 之 间 的 多 对 多 联系 .需要 引进 连接 记录 来 表示 多 对 多 的 
联系 。 


第 1 章 ”数据 库 概述 


通常 ,网 状 数据 模型 没有 层次 模型 那样 严格 的 完整 性 约束 条 件 ,但 DBTG 在 模型 DDL 


中 提供 了 定义 DBTG 数据 库 完整 性 的 若干 概念 和 语句 : 

(1) 支持 记录 码 的 概念 , 码 能 唯一 标识 记录 的 数据 项 集合 ， 

(2) 保证 一 个 联系 中 双亲 记录 和 子女 记录 之 间 是 一 对 多 的 联系 ; 

(3) 支持 双亲 记录 和 子女 记录 之 间 的 某 些 约束 条 件 。 

状 模 型 的 主要 优点 是 能 更 为 直接 地 描述 现实 世界 ,具有 良好 的 性 能 , 存 取 效率 高 。 

网 状 模型 的 主要 缺点 是 结构 复杂 。 例 如 , 当 应 用 环境 不 断 扩大 时 ,数据 库 结 构 就 变 得 很 
复杂 ,不 利于 最 终 用户 掌 握 , 编 制 应 用 程序 的 难度 比较 大 ,DBTG 模型 的 DDL、DML 语言 
杂 , 记 录 之 间 的 联系 是 通过 存 取 路 径 来 实现 的 ,因此 程序 员 必 须 了 解 系统 结构 的 细节 , 增 大 
了 编写 应 用 程序 的 难度 。 

网 状 模型 和 层次 模型 在 本 质 上 是 一 样 的 。 从 逻辑 上 看 ,它们 都 是 基本 层次 联系 的 集合 ， 
用 结 点 表示 实体 ,用 有 向 边 表示 实体 间 的 联系 。 从 物理 结构 上 看 ,它们 的 每 一 个 结 点 都 是 一 
个 存储 记录 ,用 链接 指针 来 实现 实体 之 间 的 联系 。 当 存储 数据 时 这 些 指针 就 固定 下 来 了 , 检 
索 数据 时 必须 考虑 存 取 路 径 问 题 ; 数据 更 新 时 ,涉及 链接 指针 的 调整 ,缺乏 灵活 性 ; 系统 扩 
充 相 当 麻烦 。 网 状 模型 中 的 指针 更 多 ,纵横 交错 ,从 而 使 数据 结构 更 加 复杂 。 


3. 关系 模型 


关系 模型 是 用 二 维 表格 结构 来 表示 实体 以 及 实体 之 间 联 系 的 数据 模型 。 关 系 模型 的 数 
据 结 构 是 一 个 “二 维 表 框 架 " 组 成 的 集合 ,每 个 二 维 表 又 可 称 为 关系 ,因此 可 以 说 ,关系 模型 
是 “关系 框架 "组 成 的 集合 。 目 前 大 多 数 DBMS 都 是 基于 关系 模型 的 ,所 以 它 是 我 们 重点 讨 
论 的 数据 模型 。 

关系 模型 的 特征 是 : 

。 描述 的 一 致 性 ,不 仅 实体 用 关系 描述 ,实体 之 间 的 联系 也 用 关系 描述 ; 

。 可 用 关系 直接 表示 多 对 多 的 联系 ; 

。 关系 必须 是 规范 化 的 , 即 每 个 属性 是 不 可 分 的 数据 项 ,不 允许 表 中 有 表 。 

。 关系 模型 是 建立 在 数学 概念 基础 上 的 ,有 较 强 的 理论 基础 。 

图 1-16 给 出 了 一 个 简单 的 关系 模型 ,其 中 图 1-16(a) 给 出 了 关系 模式 : 


部 门 关系 框架 部 门 关系 框架 
部 门 编号 | 名 称 | 经 理 人 数 部 门 编号 | 名 称 | 经 理 | 人 数 
01 人 事 | A001 8 
员工 关系 框架 02 销售 | B001 56 
员工 编号 | 姓名 | 性 别 | 部 门 编号 
员工 关系 框架 
员工 编号 | 姓名 性 别 部 门 编号 
A001 | 张 三 男 01 
B003 | 李 四 女 02 


(a) (b) 
图 1-16 关系 模型 示意 图 
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部 门 (部 门 编号 ,名 称 ,经 理 , 人 数 ) 。 
员工 (员工 编号 ,姓名 ,性 别 ,部 门 编号 ) 。 


图 1-16(b) 给 出 了 这 两 个 关系 模式 的 关系 ,关系 名 分 别 为 部 门 关 系 和 员工 关系 , 均 包含 
两 个 元 组 ,部门 关系 的 关键 字 为 部 门 编号 ,员工 关系 的 关键 字 为 员工 编号 。 

在 关系 模型 中 基本 数据 结构 就 是 二 维 表 , 不 用 像 层 次 模型 或 网 状 模型 那样 的 链接 指针 。 
记录 之 间 的 联系 是 通过 不 同 关 系 中 的 同名 属性 来 体现 的 。 例 如 ,要 查找 员工 * 张 三 ”所 属 的 
部 门 ,首先 要 在 员工 关系 中 根据 姓名 找到 所 属 部 门 01 ,然后 在 部 门 关 系 中 找到 01 部 门 编号 
对 应 的 名 称 即 可 。 在 上 述 查 询 过 程 中 ,同名 属性 的 "部 门 编号 ?起 到 了 联系 两 个 关系 的 纽带 
作用 。 由 此 可 见 ,关系 模型 中 的 各 个 关系 模式 不 应 当 孤 立 起 来 看 待 。 


4. 面向 对 象 数据 模型 


面向 对 象 数 据 模型 (Object-Oriented Data Model, 简 称 OO 模型 ) 是 面向 对 象 程序 设计 
方法 与 数据 库 技术 相 结 合 的 产物 ,用 以 支持 非 传 统 应 用 领域 对 数据 模型 提出 的 新 需求 。OO 
模型 的 基本 目标 是 以 更 接近 人 类 思维 的 方式 描述 客观 世界 的 事物 及 其 联系 ,并 且 使 描述 问 
题 的 问题 空间 和 解决 问题 的 方法 空间 在 结构 上 尽 可 能 一 致 ,以 便 对 客观 实体 进行 结构 模拟 
和 行为 模拟 。 

在 面向 对 象 数 据 模 型 中 ,基本 结构 是 对 象 (Object) 而 不 是 记录 ,一 切 事物 、 概 念 都 可 以 
看 做 对 象 。 一 个 对 象 不 仅 包括 描述 它 的 数据 ,而 且 还 包括 对 它 进 行 操作 的 方法 的 定义 。 另 
外 ,面向 对 象 数 据 模型 是 一 种 可 扩充 的 数据 模型 ,用 户 可 根据 应 用 需要 定义 新 的 数据 类 型 及 
相应 的 约束 和 操作 ,而 且 比 传统 数据 模型 具有 更 丰富 的 语义 。 

根据 数据 模型 的 三 要 素 : 数据 结构 .数据 操作 和 数据 约束 条 件 ,将 面向 对 象 数据 模型 与 
关系 数据 模型 做 一 简单 比较 : 

(1) 在 关系 数据 模型 中 基本 数据 结构 是 表 , 相 当 于 面向 对 象 数据 模型 中 的 类 ; 关系 模 
型 中 的 数据 元 组 相当 于 面向 对 象 数据 模型 中 的 实例 (对 象 ) ,它们 的 区 别 在 于 OO 模型 的 类 
中 还 包括 方法 ,关系 数据 模型 中 只 有 实体 的 属性 而 没有 对 实体 的 操作 。 

(2) 在 关系 数据 模型 中 ,对 数据 库 的 操作 都 归结 为 对 关系 的 运算 ,而 在 面向 对 象 数据 模 
型 中 对 类 的 操作 分 为 两 部 分 : 一 部 分 是 封装 在 类 内 的 操作 即 方法 , 另 一 部 分 是 类 间 相 互 沟 
通 的 操作 即 消息 。 

(3) 在 关系 数据 模型 中 有 域 .实体 和 参照 完整 性 约束 ,完整 性 约束 条 件 可 以 用 逻辑 公式 
表示 , 称 为 完整 性 约束 方法 。 在 面向 对 象 数据 模型 中 ,这 些 用 于 约束 的 公式 可 以 用 方法 或 消 
息 表示 , 称 为 完整 性 约束 消息 。 

总 之 ,面向 对 象 数据 模型 是 用 面向 对 象 的 观点 来 描述 现实 世界 实体 (对 象 ) 的 逻辑 组 织 、 
对 象 间 限 制 和 联系 等 的 模型 。 它 能 完整 地 描述 现实 世界 的 数据 结构 ,具有 丰富 的 表达 能 力 ， 
但 该 模型 相对 比较 复杂 ,涉及 的 知识 比较 多 ,因此 面向 对 象 数据 库 尚未 达到 关系 数据 库 的 普 
及 程度 。 面 向 对 象 数据 模型 及 面向 对 象 数据 库 的 详细 内 容 本 书 将 在 第 10 章 介绍 。 


Gs 本 章 小 结 


本 章 概述 了 数据 库 系 统 的 基本 概念 和 基本 结构 。 
本 章 首先 介绍 了 计算 机 数据 管理 的 发 展 , 曾 明 了 数据 与 信息 的 异同 。 数 据 管理 是 数据 
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处 理 的 中 心 问 题 。 随 着 计算 机 硬件 和 软件 的 发 展 ,数据 管理 经 历 了 人 工 管理 、 文 件 系统 和 数 
据 库 系统 三 个 发 展 阶段 。 

本 章 介绍 了 数据 库 管 理 系 统 和 数据 库 系 统 的 有 关 概 念 。 数 据 库 管理 系统 是 位 于 用 户 和 
操作 系统 之 间 的 一 层 数据 管理 软件 。 数 据 库 系统 三 级 模式 和 两 层 映像 的 系统 结构 保证 了 数 
据 库 系统 中 能 够 具有 和 较 高 的 逻辑 独立 性 和 物理 独立 性 。 数 据 库 语言 包括 数据 描述 语言 . 数 
据 操纵 语言 数据 控制 语言 和 宿主 语言 。 

数据 模型 是 数据 库 系 统 的 核心 和 基础 。 本 章 介绍 了 组 成 数据 模型 的 三 个 要 素 、 概 念 模 
型 和 三 种 主要 的 数据 库 模 型 。 这 几 种 最 常用 的 数据 模型 是 层次 模型 、 网 状 模型 和 关系 模型 。 
其 中 层次 模型 和 网 状 模型 统称 为 非 关 系 模型 。 本 章 除 了 介绍 层次 模型 .网 状 模型 和 关系 模 
型 的 基本 特点 外 ,还 简单 介绍 了 面向 对 象 数据 模型 。 


(1.6 习题 


1.6.1 名 词 解释 


数据 、 数 据 库 数据 库 管理 系统 、 数 据 库 系 统 、 层 次 模型 .网 状 模型 .关系 模型 .实体 -联系 
图 ,模式 、 内 模式 、 外 模式 .DDL、DML 


1.6.2 简 答 题 


1. 什么 是 数据 ? 数据 和 信息 有 什么 关系 ? 

2, 简 述 文件 系统 和 数据 库 系统 的 数据 管理 有 哪些 不 同 。 
3， 简 述 数据 库 系统 的 特点 。 

4. 数据 库 管 理 系统 的 主要 功能 有 哪些 ? 

5. 简 述 数据 库 系统 的 组 成 。 

6. 简 述 数据 库 系 统 三 级 模式 结构 。 

7. 简 述 数据 库 系统 中 的 二 级 映像 技术 及 其 作用 。 

8 

9 


. 数据库 系统 是 如 何 实 现 数 据 的 独立 性 的 ? 
.层次 模型 和 网 状 模型 的 主要 特点 是 什么 ? 
10. DBA 的 具体 职责 是 什么 ? 


1.6.3 用 E-R 图 表示 概念 模型 


1. 学 校 中 有 若干 系 , 每 个 系 有 若干 班级 和 教研 室 ,每 个 教研 室 有 若干 教师 ,其 中 有 的 教 
授 和 副教授 每 人 各 带 若干 研究 生 ; 每 个 班 有 若干 学 生 ,每 个 学 生 选 修 若 干 课程 ,每 门 课程 由 
者 干 学 生 选 修 。 

2. 某 工厂 生产 若干 产品 ,每 种 产品 由 不 同 的 零件 组 成 ,有 的 零件 可 用 在 不 同 的 产品 上 。 
这 些 零 件 由 不 同 的 原材料 制 成 ,不 同 零件 所 用 的 原材料 可 以 相同 。 这 些 零 件 按 所 属 的 不 同 
产品 分 别 放 在 不 同 的 仓库 中 ,原材料 按照 类 别 放 在 若干 仓库 中 。 

3. 某 百 货 商 店 要 设计 一 个 数据 库 系 统 , 通 过 调研 和 分 析 知 道 : 该 商店 的 一 个 重要 方面 
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是 同 供应 商 打交道 ,商店 出 售 的 商品 由 他 们 提供 ,各 供应 商 供应 多 种 商品 ,每 种 商品 可 能 从 
多 个 供应 商 处 购买 ,各 供应 商 提供 的 商品 价格 不 同 ; 该 商店 有 若干 个 部 门 ,每 个 部 门 有 一 个 
经 理 和 若干 个 雇员 ,每 个 雇员 只 属于 一 个 部 门 ; 每 个 部 门 负责 销售 某 些 商品 ,每 种 商品 规定 
只 由 一 个 部 门 销 售 ; 商店 的 顾客 开 订 单 买 商品 ,由 商店 送 货 上 门 ; 每 个 顾客 开 的 定单 数 不 
限 ,一 个 订单 由 顾客 要 求购 买 的 若干 商品 和 购买 的 数量 组 成 。 当 然 , 同 一 商品 可 被 许多 顾客 
包括 在 许多 订单 中 。 


关系 数据 库 系统 


1970 年 6 月 ,美国 IBM 公司 的 E. F. Codd 在 美国 计算 机 学 会 会 刊 (Communications of 
ACM) 上 发 表 题 为 A Relational Mode for Large Shared Data Banks( 大 型 共享 系统 的 关系 
数据 库 的 关系 模型 ) 的 论文 ,系统 而 严格 地 提出 关系 模型 这 一 概念 。 这 篇 文章 首次 明确 而 清 
晰 地 为 数据 库 系统 提出 了 一 种 革新 的 模型 , 即 关系 模型 ,开创 了 数据 库 系统 的 新 纪元 。 
ACM(Association Computing Machinery) 后 来 在 1983 年 把 这 篇 论文 列 为 自 1958 年 以 来 的 
四 分 之 一 个 世纪 里 具有 里 程 碑 式 意 义 的 最 重要 的 25 篇 研究 论文 之 一 。 由 于 关系 模型 具有 
坚实 的 数学 基础 且 简单 明了 ,一 经 提出 ,立即 引起 学 术 界 和 产业 界 的 广泛 重视 和 响应 ,在 理 
论 与 实践 两 个 方面 都 对 数据 库 技术 产生 了 强烈 的 冲击 。 自 此 ,基于 层次 模型 和 网 状 模型 的 
数据 库 产品 很 快走 向 衰败 ,一 大 批 基于 关系 模型 的 关系 数据 库 系 统 很 快 被 开发 出 来 并 迅速 
商品 化 ,占领 了 市 场 。E. F.Codd 从 1970 年 起 连续 发 表 了 多 篇 论文 , 竟 定 了 关系 数据 库 的 
理论 基础 。DB2、Oracle、Sybase、SQL Server 等 都 是 关系 DBMS。 显 然 ,关系 数据 库 是 采用 
数学 方法 来 处 理 数 据 库 中 的 数据 的 。 

关系 数据 库 系 统 是 支持 关系 模型 的 数据 库 系统 ,其 关系 模型 由 关系 数据 结构 .关系 操作 
集合 和 完整 性 约束 三 部 分 组 成 。 数 据 操作 的 方式 可 以 用 关系 代数 和 关系 演算 来 表示 。 


€.1 关系 数据 结构 


2.1.1 关系 及 相关 概念 


在 关系 模型 中 ,无论 是 实体 还 是 实体 之 间 的 联系 均 由 关系 (二 维 表 ) 来 表示 。 下 面 从 集 
合 论 的 一 些 概念 出 发 ,给 出 关系 数据 结构 的 形式 化 定义 。 


1. 域 


域 是 一 组 具有 相同 数据 类 型 的 值 的 集合 。 例 如 ,实数 .整数 . 正 整数 .小 于 100 的 正 整 
数 ,以 及 英文 字母 集合 等 都 可 以 是 域 。 


2. 笛 卡 儿 积 


给 定 一 组 域 D ,Ps ,…':'D,, 这 些 域 可 以 完全 不 同 , 也 可 以 部 分 或 完全 相同 。D ,Ds ,…,D， 
的 笛 卡 儿 积 为 : 
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Di Xx D; XXD,= {(di,d;,"",d,) | di € Di,i= 1,2,%,n}, 

其 中 每 一 个 元 素 (d ,ds,…,d,) 称 做 一 个 元 组 ,或 简称 为 元 组 。 元 素 中 的 每 一 个 值 d; 
为 一 个 分 量 。 

若 D;(i 二 1,2,…,n) 为 有 限 集 ,其 基数 为 m; (i 二 1,2,…,n), 则 Di XD;,X…XD, 的 基 
数 为 mm 二 Thi 

笛 卡 儿 积 可 以 表示 为 一 个 二 维 表 , 表 中 每 行为 一 个 元 组 ,每 列 对 应 一 个 域 。 

例如 ,有 三 个 域 : Di == 书 名 集合 BOOKNAME={C 语言 程序 设计 ,数据 结 构 、 数 据 库 
技术 },D; 二 作者 集合 AUTHOR={ 王 一, 李 二 },D; = 二 出 版 社 集 合 PUBLISHER== {清华 大 
学 出 版 社 ,天 津 大 学 出 版 社 ,科学 出 版 社 } 。 

DX D; xX D; 的 笛 卡 儿 积 如 表 2-1 所 示 , 共 有 18(3X2X 3) 个 元 组 。 

表 2-1 D,XD,XD, 的 第 卡 儿 积 


BOOKNAME AUTHOR PUBLISHER 
C 语言 程序 设计 下 一 清华 大 学 出 版 社 
C 语言 程序 设计 下 一 天 津 大 学 出 版 社 
C 语言 程序 设计 = 科学 出 版 社 
C 语言 程序 设计 李 二 清华 大 学 出 版 社 
C 语言 程序 设计 李 二 天 津 大 学 出 版 社 
C 语言 程序 设计 李 二 科学 出 版 社 
数据 结构 入 一 清华 大 学 出 版 社 
数据 结构 二 一 天 津 大 学 出 版 社 
数据 结构 = 科学 出 版 社 
数据 结构 李 二 清华 大 学 出 版 社 
数据 结构 李 二 天 津 大 学 出 版 社 
数据 结构 李 二 科学 出 版 社 
数据 库 技术 Es 清华 大 学 出 版 社 
数据 库 技术 二 一 天 津 大 学 出 版 社 
数据 库 技术 下 一 科学 出 版 社 
数据 库 技术 李 二 清华 大 学 出 版 社 
数据 库 技术 李 二 天 津 大 学 出 版 社 
数据 库 技术 李 二 科学 出 版 社 


表 2-1 所 示 的 笛 卡 儿 积 表示 了 书 名 、 作 者 、 出 版 社 所 有 可 能 的 组 合 。 
3. 关系 


Di XDs: X…XD, 的 子 集 称 做 在 域 Di ,D:,…,D, 上 的 关系 ,用 RCDi,D: ,…,D,) 表 示 。 
这 里 尺 为 关系 名 ,n 是 关系 的 目 或 度 。 

关系 是 笛 卡 儿 积 的 子 集 ,因此 关系 也 是 一 个 二 维 表 。 在 上 例 的 笛 卡 儿 积 中 取出 某 些 元 
组 可 以 构成 关系 BAP, 如 表 2-2 所 示 。 

关系 BAP 的 元 组 是 从 第 卡 儿 积 中 抽取 的 ,但 不 是 任意 抽取 的 ,例如 元 组 (C 语言 程序 设 
计 , 王 一 ,科学 出 版 社 ) 就 不 能 成 为 关系 BAP 的 元 组 ,因为 它 与 元 组 (C 语言 程序 设计 , 王 一 ， 
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清华 大 学 出 版 社 ) 相 矛盾 。 
表 2-2 关系 BAP 
BOOKNAME AUTHOR PUBLISHER 
C 语言 程序 设计 王 一 清华 大 学 出 版 社 
数据 结构 王 一 天 津 大 学 出 版 社 
C 语言 程序 设计 于 过 科学 出 版 社 
数据 库 技术 于 一 科学 出 版 社 


4. 关键 字 


关系 的 每 一 列 称 为 一 个 属性 。 若 关系 中 的 某 一 属性 组 能 唯一 地 标识 一 个 元 组 , 则 该 属 
性 称 为 候选 码 (Candidate Key)。 例 如 在 某 个 图 书馆 里 ,馆藏 的 图 书 都 有 唯一 的 编码 ,这 个 
编码 就 是 候选 码 。 

若 一 个 关系 有 若干 个 候选 码 , 则 选 定 其 中 一 个 为 主 码 (Primary Key) ,例如 ,馆藏 的 图 书 
除了 在 馆 内 唯一 的 编码 外 ,还 有 一 个 唯一 的 ISBN, 因 此 ISBN 也 是 候选 码 , 但 是 ,可 以 制定 
图 书 编号 为 主 属性 。 

有 的 时 候 主 码 是 由 多 个 属性 组 成 的 。 主 码 的 诸 属 性 称 为 主 属性 ,不 包含 在 任何 候选 码 
中 的 属性 为 非 码 属性 。 例 如 在 借阅 (图 书证 号 ,图 书 编号 ,借阅 日 期 ,应 还 日 期 ) 这 个 关系 中 ， 


图 书证 号 十 图 书 编号 为 主 码 ,所 以 图 书证 号 和 图 书 编号 均 为 主 属性 ,而 借阅 日 期 和 应 还 日 期 
为 非 码 属性 。 
5. 关系 的 约束 


从 数学 上 看 ,关系 就 是 一 个 元 数 为 K(K 宇 1) 的 元 组 的 集合 。 从 应 用 的 角度 看 ,关系 是 
一 种 规范 化 的 表格 ,满足 以 下 约束 : 

(1) 列 是 同 质 的 , 即 列 中 的 每 一 个 分 量 来 自 同 一 个 域 。 

(2) 不 同 的 列 可 以 来 自 相同 的 域 .但 属性 名 不 能 相同 , 即 同一 个 关系 中 ,属性 名 不 能 
相同 。 

(3) 列 的 顺序 无 关 紧 要 ,可 以 任意 交换 。 

(4) 行 的 顺序 无 关 紧 要 ,可 以 任意 交换 。 

(5) 关系 中 没有 重复 元 组 , 即 任意 两 个 元 组 都 不 能 完全 相同 。 

(6) 分 量 必须 取 原 子 值 , 即 每 一 个 分 量 都 是 不 可 分 的 数据 项 。 

其 中 : 约束 (5) 保 证 了 元 组 引用 的 确定 性 和 唯一 性 ; 约束 (1)(2) 保 证 了 列 的 引用 的 确 
定性 和 完整 性 ; 约束 (6) 保 证 了 行 和 列 同时 引用 的 属性 值 的 唯一 性 ; 约束 (3)(4) 表 明 构 造 
关系 时 的 自由 性 ,出 现 新 的 属性 或 元 组 时 ,可 随时 增加 在 后 面 ,无 须 调整 顺序 。 


6. 关系 的 三 种 类 型 

(1) 基本 关系 

基本 关系 (通常 又 称 基 本 关系 或 基 表 ) 是 实际 存在 的 表 , 它 是 实际 存储 数据 的 逻辑 表示 ， 
相当 于 模式 。 
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(2) 视图 表 

视图 表 是 由 基本 表 或 其 他 视图 表 导 出 的 表 。 由 于 视图 表 不 是 实际 的 表 , 它 本 身 不 独立 
存储 在 数据 库 中 ,数据 库 中 只 存放 视图 表 的 定义 ,因此 视图 表 是 虚 表 。 

(3) 查询 表 

查询 表 是 查询 结果 对 应 的 表 , 在 数据 库 中 仅 存放 查询 表 的 定义 ,查询 运行 后 才能 生成 查 
询 表 。 


2.1.2 关系 模式 


前 面 已 经 指出 了 关系 是 一 个 二 维 表 ,这 种 二 维 表 可 以 存放 两 类 信息 , 即 实体 本 身 的 信息 
和 实体 间 的 联系 。 这 种 由 表格 数据 来 表示 和 实现 实体 间 关 系 的 做 法 是 符合 自然 规律 的 ,是 
关系 模式 的 本 质 所 在 。 


1. 关系 模式 的 定义 


关系 模式 是 对 关系 的 描述 和 抽象 ,关系 是 关系 模式 在 某 一 时 刻 的 状态 或 内 容 。 换 言 之 ， 
关系 模式 是 型 ,关系 是 值 。 关 系 模 式 是 静态 的 、 稳 定 的 ,关系 是 动态 的 ,不 同时 刻 关 系 模 式 中 
的 关系 可 能 会 不 同 。 关 系 模式 和 关系 往往 统称 为 关系 。 

从 形式 化 的 角度 可 以 将 关系 模式 定义 成 一 个 五 元 组 : RIU,D,DOM,F)。 其 中 各 元 组 
表达 意义 如 下 : 

RR 一 一 关系 名 ， 

U0 一 一 属性 组 , 即 组 成 R 的 全 部 属性 的 集合 ; 

也 一 一 域 的 集合 , 即 属性 取 值 范围 的 集合 ; 

DOM 一 一 U 与 D 之 间 的 映像 

上 一 一 属性 组 U 上 的 数据 依赖 关系 的 集合 。 

关系 模式 可 以 简 记 为 RCIU) 或 RCA ,As ,…,A,) ,其 中 尺 为 关系 名 ,Ai ,As ，…,A, 为 属 

2. 关系 模式 的 优点 


(1) 数据 结构 简单 

关系 数据 模型 的 本 质 就 是 二 维 表 ,其 中 公共 属性 名 指示 着 各 表格 间 的 联系 。 

(2) 可 以 直接 处 理 多 对 多 的 关系 

层次 和 网 状 模型 不 能 直接 处 理 多 对 多 的 关系 ,而 关系 模型 由 于 采用 表格 ,可 以 直接 表示 
两 实体 间 的 联系 ,所 以 能 直接 处 理 多 对 多 的 关系 。 

(3) 能 够 一 次 提供 一 个 元 组 集合 

每 一 个 操作 命令 都 可 以 得 到 满足 某 种 条 件 的 所 有 记录 ,而 层次 与 网 状 模型 每 一 次 操作 
只 能 得 到 一 条 记录 ,如 果 要 得 到 所 有 满足 条 件 的 记录 , 则 需要 借助 主语 言 并 配合 DML 的 
命令 。 
(4) 数据 独立 性 较 高 
户 只 和 需 指 出 他 们 所 要 存放 的 数据 类 型 .数据 长 度 等 数据 本 身 的 特征 ,而 不 必 涉 及 这 些 
数据 的 物理 存放 ,因而 数据 独立 性 较 高 ; 而 在 层次 和 网 状 模型 中 ,用 户 或 多 或 少 地 都 要 对 其 
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数据 的 物理 组 织 进行 干预 。 

(5) 坚实 的 理论 基础 

关系 模型 建立 在 集合 代数 理论 的 基础 上 ,并 且 近 几 年 又 投入 了 大 量 的 人 力 物 力 ,使 得 关 
系 理论 趋 于 完善 。 而 层次 和 网 状 模 型 的 系统 研制 和 数据 库 设计 都 无 一 定 的 理论 指导 , 仅 赁 
设计 者 的 经 验 和 技术 水 平 。 因 此 ,系统 研制 和 应 用 设计 都 较为 盲目 。 由 于 关系 模型 的 系统 
研制 和 应 用 设计 有 了 理论 指导 ,所 以 在 层次 和 网 状 模 型 的 系统 中 出 现 的 很 多 问题 在 关系 模 
型 中 都 可 以 避免 。 

3. 关系 模式 的 缺点 


(1) 查询 效率 较 低 

关系 模型 的 DBMS 能 提供 较 高 的 数据 独立 性 以 及 非 过 程 化 的 查询 语言 ,因此 ,系统 的 
负担 就 很 重 , 过 去 需要 由 程序 员 做 的 工作 ,现在 全 部 由 系统 包办 代替 ,其 中 会 影响 效率 的 操 
作 是 笛 卡 儿 积 运算 和 两 个 表 的 连接 。 

(2) 关系 DBMS 实现 较 困 难 

为 提高 效率 ,必须 使 查询 优化 ,而 这 一 工作 是 复杂 的 。 

(3) 关系 DBMS 实现 要 求 规范 化 

关系 模型 的 DBMS 要 求 程 序 员 和 DBA 应 熟悉 关系 数据 库 设计 理论 ,能 够 熟练 地 进行 
关系 模式 规范 化 工作 ,以 便 充 分 发 挥 关 系 DBA 的 功能 。 


4. 关系 系统 的 六 大 目标 


关系 理论 的 创造 人 E. F. Codd 提出 的 关系 系统 的 六 大 目标 已 大 部 分 实现 ,这 六 大 目 
标 是 : 

(1) 提供 高 度 的 数据 独立 性 ; 

(2) 提供 严格 而 简明 的 数据 视图 ; 

(3) 简化 DBA 的 工作 ; 

(4) 建立 理论 基础 ; 

(5) 把 事务 管理 和 文件 管理 结合 起 来 ; 

(6) 把 基于 数据 的 应 用 程序 设计 提高 到 一 个 新 的 水 平 , 即 操作 对 象 是 记录 集合 ,而 不 是 
单个 记录 。 


2.1.3 关系 数据 库 


对 应 于 一 个 关系 模式 的 所 有 关系 的 组 合 称 为 一 个 关系 数据 库 。 关 系数 据 库 也 有 型 和 值 
之 分 。 关系 数据库 的 型 是 对 关系 数据 库 的 描述 ,包括 若干 域 和 定义 在 这 些 域 上 的 关系 模式 ， 
也 可 称 为 关系 数据 库 模 式 。 关 系数 据 库 的 值 , 是 某 一 时 刻 对 应 的 关系 的 集合 ,也 可 称 为 关系 
数据 库 。 通 常 ,关系 数据 库 模 式 和 关系 数据 库 统 称 为 关系 数据 库 。 

关系 数据 库 要 求 让 用 户 所 感觉 到 的 数据 库 是 一 张 张 表 的 集合 。 在 关系 数据 库 中 , 表 是 
逻辑 结构 而 不 是 物理 结构 。 实 际 上 ,关系 数据 库 系统 在 物理 层 可 以 使 用 任何 有 效 的 存储 结 
构 来 存储 数据 ,如 有 序 文件 、 索 引 、 喻 希 表 、 指 针 等 。 因 此 , 表 是 对 物理 存储 数据 的 一 种 抽象 
表示 ,是 对 很 多 存储 细节 的 抽象 .如 存储 记录 的 位 置 、 记 录 的 顺序 、 数 据 值 的 表示 等 ,以 及 记 
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录 的 访问 结构 ,如 索引 等 。 它 们 对 用 户 来 说 都 是 不 可 见 的 。 
关系 模式 与 关系 数据 库 中 术语 的 对 应 关系 如 下 : 
关系 全 表 
元 组 二 记录 

属性 全 字段 

关系 模式 全 数据 库 


C3 关系 操作 集合 


2.2.1 基本 关系 操作 


关系 数据 操作 的 对 象 都 是 关系 ,其 操作 结果 仍 为 关系 , 即 集 合式 操作 。 既 然 关系 模型 是 
基于 坚实 的 数学 基础 的 ,那么 关系 操作 与 数学 就 有 着 紧密 的 联系 ,因此 关系 数据 库 中 常用 的 
关系 数据 操作 有 : 

(1) 数据 查询 : 主要 操作 涉及 关系 属性 的 指定 、 元 组 的 选择 、 两 个 关系 的 合并 与 连接 
等 ,可 通过 选择 ,投影 连接、 除 、 并 ,交差 等 来 定义 和 导出 。 

(2) 数据 更 新 : 主要 操作 涉及 在 关系 中 插入 ,删除 元 组 及 修改 元 组 的 内 容 等 。 

而 表达 或 者 称 为 描述 关系 操作 的 关系 数据 语言 可 以 分 为 三 类 ,如 表 2-3 所 示 。 

表 2-3 关系 数据 语言 分 类 
1. 关系 代数 语言 例如 : ISBL 
a i 元 组 关系 演算 语言 例如 : ALPHA, QUEL 
关系 数据 语言 | 2. 关系 演算 语言 域 关系 演算 语言 例如 ,QBE 
3. 具有 关系 代数 和 关系 演算 双重 特点 的 语言 例如 : SQL 


2.2.2 关系 数据 语言 分 类 


关系 模型 与 其 他 数据 模型 相 比 ,最 具 特 色 的 是 它 的 数据 操纵 语言 。 该 语言 灵活 方便 , 表 
达能 力 和 功能 都 很 强 。 它 是 非 过 程 化 的 。 用 户 只 要 指出 做 什么 ,不 必 指 出 怎样 做 , 它 就 可 以 
独立 完成 , 它 提供 给 用 户 的 是 一 个 记录 集 , 而 不 是 一 个 记录 。 

关系 模型 的 数据 操纵 语言 之 所 以 有 这 些 特点 ,主要 原因 是 : 采取 了 最 简单 .最 规范 的 数 
据 结构 ,并 运用 了 先进 的 教学 工具 合 运算 和 谓词 演算 ,又 创造 了 几 个 特殊 运算 一 一 投 
影 、 选 择 和 连接 ,使 用 这 些 运算 可 以 对 二 维 表 进行 任意 分 割 和 组 装 ,随时 构造 出 各 式 各 样 的 
户 所 需要 的 表格 , 即 关 系 。 

作为 用 户 , 没 必要 知道 系统 在 内 部 是 怎样 分 割 和 组 装 的 ,只 需要 指出 所 要 用 到 的 数据 和 
限制 条 件 。 当 然 ,作为 系统 分 析 员 和 系统 设计 者 ,需要 了 解 内 部 的 情况 。 


1. 关系 代数 


关系 代数 用 代数 方式 对 关系 进行 运算 来 表达 查询 要 求 , 它 是 以 集合 操作 为 基础 的 运算 ， 
即 操作 的 对 象 结果 都 是 集合 。 查 询 表达 式 中 需要 指明 操作 的 先后 顺序 。 
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2. 关系 演算 


关系 演算 用 谓词 方式 来 表达 查询 要 求 。 关 系 演算 又 可 按 谓 词 变 元 的 基本 对 象 是 元 组 变 
量 还 是 域 变 量 分 为 元 组 关系 演算 和 域 关系 演算 两 种 。 关 系 代数 ,元 组 关系 演算 和 域 关 系 演 
算 这 三 种 语言 在 表达 能 力 上 是 完全 等 价 的 。 

关系 代数 ,元 组 关系 演算 和 域 关系 演算 均 是 抽象 的 查询 语言 ,这 些 抽 象 的 语言 与 具体 的 
DBMS 中 实现 的 实际 语言 并 不 完全 一 样 ,但 它们 能 用 做 评估 实际 系统 中 查询 语言 能 力 的 标 
准 或 基础 。 


3. SQL 


介 于 关系 代数 和 关系 演算 之 间 的 语言 SQL(Structured Query Language, 结 构 化 查询 
语言 ), 是 由 IBM 公司 在 研制 System R 时 提出 的 ,SQL 不 仅 具有 丰富 的 查询 功能 ,而 且 具 
有 数据 定义 和 数据 控制 功能 ,是 集 数据 查询 语言 (DQL) 数据 定义 语言 (DDL) 、 数 据 操纵 语 
言 (DML) 和 数据 控制 语言 (DCL) 于 一 体 的 关系 数据 语言 。SQL 充分 体现 了 关系 数据 语言 
的 特点 和 优点 ,是 关系 数据 库 的 标准 语言 。 

在 实际 应 用 的 关系 数据 库 管 理 系统 中 所 使 用 的 查询 语言 功能 十 分 强大 ,除了 提供 关系 
代数 与 关系 演算 的 功能 外 ,还 包含 了 许多 附加 功能 ,如 至 集 函 数 、 关 系 赋值 ,算术 运算 等 ,其 
至 还 具备 一 定 的 编程 能 力 。 目 前 使 用 最 广泛 的 SQL 语言 不 但 同时 具有 关系 代数 语言 和 关 
系 演算 语言 的 双重 特点 ,而 且 具 有 数据 定义 和 数据 控制 功能 ,是 集 查 询 .DDL、DML 和 DCL 
于 一 体 的 关系 数据 语言 。 


E3 完整 性 约束 


关系 模型 的 完整 性 规则 是 对 关系 的 某 种 约束 条 件 。 关 系 模型 中 可 以 有 三 类 完整 性 约 
束 : 实体 完整 性 参照 完整 性 和 用 户 定义 的 完整 性 。 其 中 实体 完整 性 和 参照 完整 性 是 关系 
模型 必须 满足 的 完整 性 约束 条 件 , 称 为 关系 的 两 个 不 变性 ,应 该 由 关系 系统 自动 支持 。 下 面 
分 别 介绍 这 三 类 完整 性 约束 。 


2.3.1 实体 完整 性 


所 谓 实体 完整 性 ,就 是 指 一 个 关系 模型 中 的 所 有 元 组 都 是 唯一 的 ,没有 两 个 完全 相同 的 
元 组 ,也 就 是 说 一 个 二 维 表 中 没有 两 个 完全 相同 的 行 , 也 称 为 行 完整 性 。 在 数据 输入 或 修改 
过 程 中 ,完全 相同 的 行 不 能 存储 。 一 般 来 说 ,元 组 对 应 现实 世界 的 一 个 实体 ,所 以 称 这 种 约 
束 为 实体 完整 性 约束 。 在 具体 实现 过 程 中 ,用 户 可 以 为 自己 的 关系 模型 定义 一 个 唯一 性 关 
键 字 , 一 般 的 关系 数据 库 系统 都 会 阻止 两 个 关键 字 相 同 的 元 组 存 人 系统 中 。 

实体 完整 性 规则 : 若 属 性 (组 )A 是 基本 关系 R 主 码 上 的 属性 , 则 属性 A 不 能 取 空 值 。 

说 明 : 

(1) 实体 完整 性 规则 是 对 基本 关系 的 约束 和 限定 。 一 个 基本 关系 表 通 常 对 应 一 个 实体 
集 。 例 如 ,读者 关系 对 应 读者 集合 。 
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(2) 现实 世界 中 的 实体 是 可 以 区 分 的 ,它们 具有 一 种 唯一 性 质 的 标识 。 例 如 ,读者 的 图 
书证 编号 、 图 书 的 图 书 编号 等 。 

(3) 在 关系 模型 中 , 主 码 作为 唯一 的 标识 且 不 能 为 空 。 组 成 主 码 的 每 一 个 属性 都 不 能 
取 空 值 。 

注意 : 有 多 个 候选 码 时 , 主 码 以 外 的 候选 码 上 可 取 空 值 。 

在 表 2-4 所 示 的 “读者 "关系 中 ,图 书证 编号 是 主 码 ( 因 为 图 书证 编号 唯一 确定 这 个 读者 
的 属性 ), 也 是 主 属性 ,但 是 第 四 条 记录 的 讲师 编号 是 空 值 ,因此 关系 不 满足 实体 完整 性 规 
则 。 当 然 ,目前 的 关系 DBMS 都 会 自动 帮助 用 户 完成 完整 性 的 约束 检查 , 即 自 动 支持 满足 
实体 完整 性 规则 。 


表 2-4 读者 表 
图 书证 编号 姓名 类 型 性 别 出 生日 期 
S001 王 红 大 本 女 1989-02-13 
S002 张 静 研究 生 女 1984-06-20 
To01 每 欣 副教授 女 1972-03-26 
李 雷 讲师 男 1975-09-16 


2.3.2 参照 完整 性 


现实 世界 中 的 实体 集 之 间 往 往 存在 某 种 联系 ,在 关系 模型 中 ,实体 集 及 实体 集 间 的 联系 
都 是 用 关系 来 描述 的 。 这 样 就 自然 存在 着 关系 与 关系 间 的 引用 。 

例如 ,有 如 下 学 生 和 院 系 两 个 实体 集合 。 

学 生 ( 学 号 ,姓名 ,性 别 ,年龄 , 院 系 编号 ) ,其 中 学 号 为 主 码 。 

院 系 ( 院 系 编号 , 系 主任 ,办 公 地 点 ), 其 中 院 系 编号 为 主 码 。 

这 两 个 关系 之 间 存 在 着 属性 的 引用 , 即 学 生 关系 引用 了 院 系 关系 的 主 码 “ 院 系 编号 ”。 

显然 ,学 生 关系 中 “ 院 系 编号 ”的 值 必须 是 在 院 系 表 中 确实 存在 的 , 即 学 院 关 系 中 有 该 
院 系 的 记录 。 这 说 明 学 生 关 系 中 某 个 属性 的 取 值 要 参照 院 系 关系 的 属性 取 值 , 即 本 学 校 的 
学 生 就 读 的 不 可 能 是 本 学 校 没 有 开设 的 院 系 。 在 这 种 情况 下 ,“ 院 系 编号 ”不 是 学 生 关系 的 
主 关 键 字 ,但 是 它 是 院 系 关系 的 主 码 , 故 称 * 院 系 编号 "是 学 生 关 系 的 外 码 。 

又 如 有 以 下 实体 集 : 

学 生 ( 学 号 ,姓名 ,性别 ,年龄 , 院 系 编号 ) ,其 中 学 号 为 主 码 。 

0 学 分 ,学 时 ) ,其 中 课程 号 为 主 码 。 

选课 (学 号 ,课程 号 ,成 绩 ) ,其 中 学 号 与 课程 号 联合 为 主 码 。 

引用 关系 是 指 关系 中 某 属 性 的 值 需要 参照 另 一 关系 的 属性 来 取 值 。 设 选课 关系 引用 了 
学 生 关 系 的 主 码 “学 号 ”和 课程 关系 的 主 码 “课程 号 ”。 显 然 , 选 课 关 系 中 的 “学 号 ” 值 必须 是 
学 生 关系 中 实际 存在 的 某 学 号 ; 选课 关系 中 的 “课程 号 ” 值 也 必须 是 已 开设 的 某 课 程 号 。 换 
言 之 ,选课 关系 中 某 些 属性 的 值 需 要 参照 学 生 关 系 及 课程 关系 对 应 的 属性 内 容 来 取 值 。 称 
选课 关系 为 参照 关系 (或 依赖 表 ) ,学 生 关 系 和 课程 关系 为 目标 关系 (或 被 参照 关系 )。 

不 仅 两 个 或 两 个 以 上 的 关系 之 间 可 以 存在 引用 关系 ,而 且 同 一 关系 内 部 属性 间 也 可 能 
存在 引用 关系 。 课 程 关系 中 的 “前 导 课 编 号 "必须 参照 课程 关系 中 的 “课程 号 ”, 因 此 ,课程 关 
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系 既是 参照 关系 ,又 是 目标 关系 。 
照 完整 性 的 定义 : 设 有 基本 关系 RS( 可 为 同一 关系 )。 车 下 是 R 的 一 个 属性 (组 )， 

但 不 是 R 的 码 , 如 果 下 与 S 的 主 码 K 相对 应 , 则 称 下 是 R 的 外 码 , 并 称 尺 为 参照 关系 ,S 为 
目标 关系 。 

不 难看 出 , 主 码 K 和 外 码 下 必须 定义 在 相同 域 上 ,它们 相对 应 即 有 引用 关系 。 

下 面 的 参照 完整 性 规则 界定 了 主 码 与 外 码 间 的 引用 关系 。 

参照 完整 性 规则 : 若 属 性 (或 属性 组 )F 是 基本 关系 R 的 外 码 , 它 与 基本 关系 S 的 主 码 
KK, 相对 应 (基本 关系 R 和 S 不 一 定 是 不 同 的 关系 ), 则 对 于 R 中 每 个 元 组 在 下 上 的 值 必 
须 为 : 

。 或 者 取 空 值 CF 的 每 个 属性 值 均 为 空 值 ) 。 

。 或 者 等 于 S 中 某 个 元 组 的 主 码 值 。 

简单 说 来 , 即 当 一 个 数据 表 中 有 外 部 关键 字 ( 即 该 列 是 另外 一 个 表 的 关键 字 ) 时 ,外 部 关 
键 字 列 的 所 有 值 ,都 必须 出 现在 其 所 对 应 的 表 中 ,这 就 是 参照 完整 性 的 含义 。 其 作用 一 般 有 
如 下 3 个 方面 : 

(1) 禁止 从 表 中 插入 主 表 中 不 存在 的 关键 字 的 数据 行 。 

(2) 禁止 会 导致 从 表 中 的 相应 值 孤 立 的 主 表 中 外 部 关键 字 值 的 改变 。 

(3) 禁止 删除 与 从 表 中 有 对 应 记录 的 主 表 记 录 。 

参照 完整 性 约束 保证 了 两 个 有 关联 的 表 相互 连接 的 正确 性 。 

参照 完整 性 又 称 引 用 完整 性 , 它 定义 了 外 码 与 主 码 之 间 的 引用 规则 。 

外 码 与 主 码 提供 了 一 种 表示 元 组 之 间 联 系 的 手段 。 外 码 要 么 空缺 ,要 么 引用 一 个 实际 
存在 的 主 码 值 。 

在 上 面 的 例子 中 ,学 生 关 系 中 每 个 元 组 的 “ 院 系 号 ”只 能 取 下 面 两 类 值 : 

。 空 值 ,表示 该 学 生 刚 被 录取 ,尚未 分 配 到 院 系 。 

。 非 空 值 ,这 时 该 值 必须 是 院 系 关系 中 某 个 院 系 号 的 值 。 

同 理 , 课 程 关系 中 每 个 元 组 的 “前 导 课 编号 ?只 能 取 某 一 课程 号 值 或 为 空 值 , 若 为 空 值 则 
表示 该 没有 前 导 课 等 。 

在 选课 关系 的 例子 中 .选课 关系 中 的 “学 号 ”与 学 生 关系 的 主 码 “ 学 号 ”相对 应 ,因此 是 外 
码 ; 选修 关系 中 的 “课程 号 ”与 课程 关系 的 主 码 * 课 程 号 ”相对 应 , 故 也 是 外 码 。 根 据 参 照 完 
整 性 规则 ,它们 要 么 空缺 ,要 么 引用 对 应 关系 中 实际 存在 的 主 码 值 。 但 由 于 选修 关系 自身 的 
主 码 为 “学 号 ”与 “课程 号 ”, 又 根据 实体 完整 性 规则 可 知 ,它们 均 不 能 为 空 。 故 只 能 取 对 应 目 
标 关系 中 的 实际 值 ,而 不 能 取 空 值 。 


2.3.3 用 户 定义 完整 性 


除 实体 完整 性 和 参照 完整 性 约束 之 外 ,关系 数据 库 系统 还 应 该 能 够 根据 其 应 用 环境 的 
不 同 , 让 用 户 添加 一 些 特殊 的 约束 条 件 来 满足 其 需要 ,由 此 引出 用 户 定义 完整 性 的 概念 。 所 
谓 用 户 定义 完整 性 就 是 针对 某 一 具体 应 用 的 关系 数据 库 的 具体 的 应 用 需求 ,而 对 其 数据 进 
行 的 必要 的 约束 条 件 , 它 反映 某 具 体 应 用 所 涉及 的 数据 必须 满足 的 要 求 。 例 如 ,学 生 关系 中 
的 年 龄 在 15 一 75 之 间 ,选修 关系 中 的 成 绩 在 0 一 100 之 间 ; 更 新 职工 表 时 ,工资 .工龄 等 属 
性 值 通常 只 增加 不 减少 ; 等 等 。 这 类 约束 条 件 不 必 放 在 应 用 程序 中 去 检验 ,而 由 数据 库 系 
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统 去 检验 这 一 完整 性 约束 ,以 减少 应 用 程序 的 工作 量 。 

关系 模型 应 提供 定义 和 验证 这 类 完整 性 的 机 制 ,以 便 用 统一 的 系统 方法 处 理 它们 ， 
而 不 要 让 应 用 程序 承担 这 一 功能 。 关 系数 据 库 系统 一 般 包 括 以 下 几 种 用 户 定义 的 完整 
性 约束 : 

(1) 定义 属性 是 否 为 空 值 ; 

(2) 定义 属性 值 的 唯一 性 ; 

(3) 定义 属性 的 取 值 范围 ; 

(4) 定义 属性 的 默认 值 ; 

(5) 定义 属性 间 函 数 依赖 关系 。 


@.4 关系 代数 


2. 2 节 讲 述 了 描述 关系 操作 的 关系 数据 语言 可 以 分 为 三 类 : 关系 代数 、 关 系 演算 和 介 
于 关系 代数 与 关系 演算 之 间 的 语言 SQL。 下 面 专门 讲述 用 对 关系 进行 运算 来 表达 查询 要 
求 的 关系 代数 。 关 系 代数 的 运算 对 象 是 关系 ,运算 结果 也 是 关系 。 关 系 代数 用 到 的 运算 符 
包括 四 类 : 集合 运算 符 ,专门 的 关系 运算 符 、 算 术 比 较 运算 符 和 人 逻辑 运算 符 ,其 中 比较 运算 
符 和 逻辑 运算 符 是 用 来 辅助 运算 的 专门 关系 运算 符 , 如 表 2-5 所 示 。 


表 2-5 关系 运算 符 
传统 集合 运算 符 专门 的 关系 运算 符 


传统 的 集合 运算 包括 并 \ 交 、 差 和 广义 笛 卡 儿 积 等 。 集 合 运算 把 关系 看 做 元 组 的 集合 
从 水 平 ( 行 ) 方 向 进行 运算 .广义 笛 卡 儿 积 把 两 个 关系 的 元 组 以 所 有 可 能 的 方式 组 成 对 。 

专门 的 关系 运算 包括 选择 ,投影 连接 和 除 等 , 既 从 行 又 从 列 的 方向 进行 运算 。“ 选 择 ” 
会 删除 某 些 行 ;“ 投 影 ” 会 删除 某 些 列 : 各 种 连接 运算 将 两 个 关系 的 元 组 中 有 选择 地 组 成 
对 ,构成 一 个 新 关系 。 


2.4.1 传统 的 集合 运算 


传统 的 集合 运算 包括 并 、 交 、 差 、 广 义 笛 卡 儿 积 四 种 运算 。 其 中 ,并 、 交 、 差 要 求 R 和 5S 
设 关 系 尺 和 S 是 相 容 的 ,是 指 关 系 R 和 关系 S 具有 相同 的 目 n( 即 两 个 关系 都 及 个 
属性 ) , 且 相 应 的 属性 取 自 同一 个 域 ,其 结果 关系 仍 为 nn 目 关 系 。 


1. 并 


尺 和 S 的 并 (UNION) 记 作 : RUS = {zt€ERV+ES) 


RUS 的 结果 生成 一 个 新 关系 ,由 属于 R 的 或 属于 S 的 所 有 元 组 组 成 ,如 图 2-1(a) 所 


示 。RUS 的 具体 算 例如 图 2-2 所 示 。 
多 
@ 


(b) 交 (0) 差 
图 2-1 传统 集合 运算 并 、 交 、 差 的 图 示 


局 


注意 : 

(1)R 和 S 的 并 ,RUS, 是 在 RR 或 S 或 两 者 中 的 元 组 的 集合 ; 

(2) 一 个 元 组 在 并 集中 只 出 现 一 次 ; 

(3) R 和 S 必须 同类 型 (属性 集 相 同 、 次 序 相同 ,但 属性 名 可 以 不 同 )。 


2 变 


RR 和 S 的 交 (INTERSECT) 记 作 : RNS 二 (itERAIES } 

RNMS 的 结果 生成 一 个 新 关系 ,由 属于 R 的 或 属于 S 的 所 有 元 组 组 成 ,如 图 2-1(b) 所 
示 。RNS 的 具体 算 例如 图 2-2 所 示 。 

注意 : 

(1) 尺 和 S 的 交 ,R 门 S, 是 在 RR 和 S 中 都 存在 的 元 组 的 集合 ; 

(2) 一 个 元 组 在 交集 中 只 出 现 一 次 ; 

(3) R 和 S 必须 同类 型 (属性 集 相同 、 次 序 相同 ,但 属性 名 可 以 不 同 )。 


3. 差 


RR 和 S 的 差 (MINUS) 记 作 : R 一 S= 二 {1|1€ERAr¢S} 

R 一 S 的 结果 生成 一 个 新 关系 ,由 属于 R 的 或 属于 S 的 所 有 元 组 组 成 ,如 图 2-1(c) 所 
示 。R 一 S 的 具体 算 例如 图 2-2 所 示 。 

注意 : 

(1) RR 和 S 的 差 ,R 一 S, 是 在 尺 中 而 不 在 S 中 的 元 组 的 集合 ; 

(2) R 和 S 必须 同类 型 (属性 集 相同 、 次 序 相同 ,但 属性 名 可 以 不 同 )。 

两 关系 的 交集 可 以 通过 差 运 算 导 出 : RN S= R 一 (R 一 S) 


4. 广义 笛 卡 儿 积 


两 个 分 别 为 n 目 和 wm 目的 关系 R 和 S 的 广义 笛 卡 儿 积 是 一 个 (nXm) 列 的 元 组 的 集 
合 。 元 组 的 前 nn 列 是 关系 R 的 一 个 元 组 ,后 m 列 是 关系 S 的 一 个 元 组 。 若 尺 有 Al 个 元 组 ， 
S 有 k2 个 元 组 , 则 关系 R 和 关系 的 广义 笛 卡 儿 积 有 k1Xk2 个 元 组 , 记 为 RX S, 可 表示 为 
RXS={tt,|t ERAMzES} 

即 结果 是 R 中 的 每 一 个 元 组 分 别 与 S 中 的 所 有 元 组 连接 构成 新 关系 RXS 的 元 组 。 
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图 2-2 关系 RR 和 S 的 传统 集合 运算 算 例 


2.4.2 专门 的 关系 运算 


专门 的 关系 运算 包括 选择 .投影 .连接 、 除 等 。 

在 学 习 专 门 的 关系 运算 之 前 , 先 了 解 一 些 术语 及 其 表示 。 

。 设 关系 模式 为 RCA ,As,…,A,), 它 的 一 个 关系 设 为 1,+€E R 表示 上 是 尺 的 一 个 元 
组 ,t[A;] 则 表示 元 组 t 中 相对 于 属性 A; 的 一 个 分 量 。 

。 车 A={An ,Az，,…,Ax}) 其 中 Aa .Az.…,Az 是 Ai,As,…,A, 中 的 一 部 分 , 则 称 为 

属性 列 或 属性 组 。i[Aj 二 (LAaj,t[LAzj,…,t[LAaj]) 表示 元 组 1 在 属性 列 A 上 诸 
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分 量 的 集合 。A 则 表示 {Ai ,As,…,A,} 中 去 掉 {Aa ,Az ,…,Aa} 后 剩余 属性 组 。 


。 尺 为 nn 目 关系 ,S 为 m 目 关系 ,t, ER,1,E S,14, 称 为 元 组 的 连接 (Concatenation) 它 

是 一 个 n 十 m 列 的 元 组 ,前 个 分 量 为 R 中 的 一 个 nn 元 组 ;后 m 个 分 量 为 S 的 一 个 

m 元 组 。 

给 定 一 个 关系 R(X,2Z),X 和 2 为 属性 组 。 当 t[X] 二 x 时 ,zx 在 R 中 的 象 集 定 义 为 : 
= ee RX] 二 

它 表 示 R 中 属性 组 X 上 值 为 x 的 诸 元 组 在 Z 上 分 量 的 集合 。 

对 于 表 2-6 所 示 的 关系 ,X=={S}, 则 : 

001 在 RR 中 的 象 集 Zoor 二 {(C1,80), (C2,85),(C3,90)} 

002 在 R 中 的 象 集 Zoo 一 {(C2,95)} 

003 在 R 中 的 象 集 Zoos 二 {(C2,90),(C3,85))} 


表 2-6 关系 SCG 


S 让 G S C 人 
001 Cl 80 002 C2 95 
001 C2 85 003 2 90 
001 C3 90 003 C3 85 

1. 选择 


选择 是 对 关系 的 水 平分 解 运算 ,是 对 关系 进行 的 操作 的 元 组 组 成 新 关系 。 选 择 运 算 表 
示 为 : 


or(R)={t|t:€ERA FG)=T) 
其 中 : c 为 选择 运算 符 ; R 是 关系 名 ; 下 为 逻辑 表达 式 。 下 中 的 运算 对 象 通常 为 常量 、 
函数 或 元 组 分 量 ,运算 符 为 比较 运算 符 和 逻辑 运算 符 ,表示 的 条 件 取 值 为 工 或 下 。 
选择 运算 是 从 关系 的 水 平方 向 进行 的 运算 ,是 从 关系 RR 中 选择 满足 给 定 条 件 的 所 有 元 
组 。 选 择 运算 如 图 2-3(a) 所 示 。 


2. 投影 


投影 是 对 关系 的 垂直 分 解 运算 , 即 从 关系 的 属性 集中 选择 属性 子 集 ,构成 的 元 组 组 成 一 

个 新 关系 。 投 影 操 作 表示 为 : 
nA(R)= {t[A] | te R} 

其 中 : x 为 投影 运算 符 ; R 是 关系 名 ; A 表示 关系 R 中 的 属性 子 集合 。 该 操作 从 关系 
R 中 移出 部 分 列 ,只 保留 A 列 组 成 一 个 新 的 关系 ,并 去 掉 重 复 的 元 组 。 新 关系 中 的 属性 值 
来 自 原 关系 中 相应 的 属性 值 , 列 的 次 序 在 新 关系 中 可 以 重新 排列 。 

投影 之 后 不 仅 取消 了 原 关 系 中 的 某 些 列 ,而且 还 可 能 取消 某 些 元 组 ,因为 取消 了 某 些 属 
性 列 后 ,就 可 能 出 现 重复 行 .应 取消 这 些 完全 相同 的 行 。 投 影 运 算 如 图 2-3(b) 所 示 。 

可 以 同时 对 某 个 关系 进行 选择 和 投影 操作 .得 出 想 要 的 结果 , 即 进 行 所 谓 的 查询 操作 。 

注意 : 当 要 对 某 一 关系 进行 选择 和 投影 操作 时 ,一 定 要 先 选择 后 投影 ,因为 投影 是 对 列 
的 筛选 ,如 果 先 投影 ,就 会 把 要 进行 选择 的 条 件 属性 切除 掉 , 使 得 选择 操作 无 法 进行 。 
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TS 
ss 
RN 
(a) 选择 (b) 投影 
RR 
NM 
(9) 连接 
图 2-3 选择 .投影 .连接 的 图 示 
3. 连接 
连接 是 从 两 个 关系 的 广义 笛 卡 儿 积 中 选择 属性 间 满 足 一 定 条 件 的 元 组 的 运算 。 表 示 为 


RMS = {tt |i €E RA ESA LAlLB])} 

其 中 ,A 和 B 分 别 为 R 和 S 上 可 比 的 属性 组 ; 9 是 比较 运算 符 。 连 接 运算 从 R 和 S 的 
笛 卡 儿 积 RXS 中 选取 在 A 属性 组 (R 关系 ) 上 的 值 与 在 B 属 性 组 (S 关系 ) 上 的 值 满足 比较 
关系 9 的 元 组 ,如 图 2-4 所 示 。 

连接 运算 中 有 两 种 最 为 重要 的 也 是 很 常用 的 连接 ,一 种 是 等 值 连接 ,一 种 是 自然 连接 。 

(1) 等 值 连接 与 自然 连接 

0 为 “二 ”的 连接 运算 , 称 为 等 值 连接 。 它 是 从 关系 尺 与 S 的 广义 笛 卡 儿 积 中 选取 A、B 
属性 值 相等 的 那些 元 组 ,如 图 2-4 所 示 。 等 信 连 接 为 R pq S, 记 作 ， 


REIS= {li ERNtESALLA = LB])} 
自然 连接 是 一 种 特殊 的 等 值 连 接 , 它 要 求 等 值 连接 的 连接 属性 是 相同 属性 (或 属性 组 )， 


即 R 和 S 具有 相同 的 属性 组 , 且 该 组 属性 具有 相同 的 列 值 , 则 该 等 值 连接 称 为 自然 连接 
及 [xd4S , 记 为 : 


RMS= {tt |i€ERNt ESAuLB] = 6B])} 
自然 连接 的 结果 关系 中 要 去 掉 重 复 的 属性 。 假 定 尺 和 S 具有 的 相同 属性 A, 且 RR 及 
个 属性 ,S 及 个 属性 ,自然 连接 的 结果 有 (n 十 m 一 了 个 属性 。 
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R RPAS 
oD 

4 B C BR Se 
al 3 cl 9 c | a 5 
al 5 | a 9 c | a 5 
al 9 | oe 12 | | 所 5 
a2 9 | < 9 c | 2 而 
a2 12 | c2 9 c2 | c2 7 
a3 2 | «a 12 c | 2 7 

12 | | e 9 


图 2-4 关系 RR 和 S 的 连接 运算 


等 值 连接 、 自 然 连接 的 示例 如 图 2-4 所 示 , 其 中 关系 R 和 关系 S 有 共同 属性 C, 假 设 C 
是 同 值 的 , 即 两 个 关系 的 C 是 来 自 同 一 个 域 并 且 意 义 相同 ,自然 连接 的 结果 比 等 值 连接 少 
一 个 或 多 个 属性 。 

本 例 中 采用 的 连接 方法 是 从 理论 上 分 析 的 方法 ,由 于 两 个 关系 取 广义 笛 卡 儿 积 运算 非 
常 费 时 ,实际 的 DBMS 所 采用 的 连接 算法 更 有 可 能 是 优化 的 算法 。 

注意 : 一 般 对 表 的 查询 是 结合 选择 投影 和 自然 连接 进行 的 。 可 以 同时 对 某 个 关系 进行 
连接 .选择 和 投影 操作 ,得 出 想 要 的 结果 , 即 进行 所 谓 的 查询 操作 。 

(2) 外 连接 

外 连接 运算 是 对 连接 运算 的 扩展 ,可 以 处 理 缺 失信 息 。 自 然 连 接 是 选择 两 个 关系 在 公 
共 属 性 组 上 值 相等 的 元 组 构成 的 ,因此 与 公共 属性 组 值 不 同 的 及 与 S 的 元 组 被 忽略 了 。 例 
如 图 2-4 所 示 的 自然 连接 运算 ,R 中 的 元 组 (a3,2,c4) 和 S 中 的 元 组 (c3,9) 就 被 忽略 掉 了 。 
如 果 把 舍弃 的 元 组 也 保存 在 结果 关系 中 ,而 在 其 他 属性 上 填空 值 (Null) ,那么 这 种 连接 就 叫 
做 外 连接 (OUTER JOIN)。 

如 果 只 把 左边 关系 R 中 要 舍弃 的 元 组 保留 ,就 叫做 左 外 连接 (LEFT OUTER JOIN 或 
LEFT JOIN); 如 果 只 把 右边 关系 S 中 要 舍弃 的 元 组 保留 ,就 叫做 右 外 连接 (RIGHT 
OUTER JOIN 或 RIGHT JOIN) 。 

图 2-4 中 的 关系 尺 与 关系 S 的 外 连接 、 左 外 连接 、 右 外 连接 运算 如 图 2-5 所 示 。 


4. 除 


除 运算 是 同时 从 关系 的 水 平方 向 和 垂直 方向 进行 运算 。 对 于 给 定 关系 R(X,Y) 和 
S(Y,2Z) ,其 中 XY、Z 为 属性 组 ,R 中 的 Y 与 S 中 的 Y 可 以 有 不 同 的 属性 名 ,但 必须 出 自 相 
同 的 域 集 。R 二 S 应 当 满 足 元 组 在 X 上 的 分 量 值 zx 的 象 集 ,Y, 包含 关系 S 在 属性 Y 上 的 投 
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影 的 集合 。R 二 S 记 作 : 
RS= {XI ERA mS)EY,} 


B 
al 2 cl 5 al 2 cl 5 
al 5 cl 5 al 5 cl 5 
al 9 c2 风 al 9 c2 未 
a2 9 c2 区 a2 9 c2 
12 2 a2 12 c2 n a2 12 c2 7 
a3 2 ct [NULL a3 2 ct [NULL NULL|NULL| cs 9 
NULL|NULL| <3 9 
图 2-5 关系 尺 和 3S 的 外 连接 运算 


其 中 ,Y; 为 xz 在 R 中 的 像 集 ,x = 1.[X] 
如 图 2-6 所 示 ,计算 在 关系 R 二 S。 


解 : 根据 除法 定义 ,此 题 X 为 属性 AB,Y 为 属性 CD。R 二 S 应 当 满 足 元 组 在 属性 AB 


上 的 分 量 值 的 像 集 Y, 包 含 关 系 S 在 CD 上 投影 的 集合 。 

关系 S 在 Y 上 投影 的 集合 为 xm (S) = { (c,d), (e, 内) 
AB 可 以 取 三 个 值 { (a, 0 ，(0，cd) ，(c, A) } ,它们 的 像 集 分 别 为 : 

(a, 5) 的 像 集 为 { (c,d), (Ce, f), (hh, k)} 

(5b, qd) 的 像 集 为 { (e, /), (d, 1) } 

(Cc,，k&) 的 像 集 为 { (c,d), (e, /)} 

S 在 (a, 5) 和 (c,k) 的 像 集 包含 了 S 在 CD 属性 组 上 的 投影 { (c,d)， 

所 以 RS={ (a, 6b), (c, k) }。 


(e, f)} 


图 2-6 关系 RS 运算 


2.4.3 综合 算 例 


假设 有 如 下 基本 关系 (如 图 2-7 所 示 ) : 
学 生 关 系 S( 学 号 Sno、 姓 名 Sname 性别 Ssex、 年 龄 Sage、 所 在 班 Sclass); 
课程 关系 C( 课 程 号 Cno、 名 称 Cname、 先 行 课 Cpno、 学 分 Ceredit) ; 


) ,对 于 关系 尺 ,属性 组 XX, 即 
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选课 关系 SC( 学 号 Sno .课程 号 Cno 成 绩 Grade) 。 
【 例 2.1】 查询 软件 工程 0601 班 的 (SE0601 班 ) 全 体 学 生 


Gsdass = 'sEo601'(S) 或 gs = ,spo601'(S) 


二 


运算 结果 为 : 
Sno Sname Ssex Sage Sclass 
2006111121 王 昕 F pa SE0601 
2006111122 李 伟 M 20 SE0601 


【 例 2.2】 查询 所 有 课程 的 名 称 和 学 分 


Cname, cadit(C) 或 xt2, 4 (C) 


运算 结果 为 : 
Cname Ceredit Cname Ceredit 
高 等 数学 6 数据 库 原理 3 
程序 设计 基础 6 面向 对 象 程序 设计 4 
数据 结构 6 操作 系统 4 
计算 机 原理 1 计算 机 网 络 技术 3 


| 04 | 计算 机 原理 
05 数据 理 


2007111001 03 64 
2007111001 05 81 
2007111001 06 ng 
2006111121 02 92 
2006111121 03 85 
2006111121 04 87 
2006111121 05 95 
2009112001 01 79 
2009112001 02 86 


图 2-7 综合 算 例 的 基本 关系 
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【 例 2.3】 查询 没有 先行 课 的 名 称 和 学 分 


NCname, Ceredit (GCpno= NULL(C) ) 或 rez, 4 (03= NuL CC)) 


运算 结果 为 : 
Cname Ceredit 

高 等 数学 6 

计算 机 原理 4 


【 例 2.4】 查询 选修 了 “02” 课 程 的 学 生 姓名 
NSname ( KSname, Sno( S) DA ocno = 02'( SC)) 


运算 结果 为 : 
Sname 
王 昕 
李 彤 
【 例 2.5】 查询 学 号 为 2006111121 的 学 生 选 修 的 课程 名 称 和 成 绩 
NCname, Grade (Cno (C) DA Gsno = 2006111121'( SC)) 
运算 结果 为 
Cname Grade 
程序 设计 基础 92 
数据 结构 85 
计算 机 原理 87 
数据 库 原理 95 


【 例 2.6】 查询 选修 了 课程 02 的 学 生 学 号 和 姓名 
Tsuo, Sname ( Sno, sname (S) DA ocn = v2'( SC)) 


运算 结果 为 : 
Sno Sname 
2006111121 王 昕 
2009112001 李 彤 


【 例 2.7】 查询 选修 了 课程 “数据 结构 "的 学 生 姓 名 和 所 在 班级 


NSname, Sclass ( Sno, Sname, Sclass (S) [> sno,Cno (SC ) [> rcno (GCname— 履 据 结构 《CC) ) ) 


运算 结果 为 
Sname Sclass 
张 字 CS0701 
王 昕 SE0601 


由 


【 例 2.8】 查询 没有 选修 课程 02 的 学 
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Tsmo(S) 一 (nsno Gcno = oz(SC))) 


Sno 


2007111001 
2007111002 
2006111122 
2009111001 


【 例 2. 9】 查询 选修 了 课程 02 和 课程 03 的 学 生 学 号 


Nsno, cno(SC ) 二 (rcno(acno -2， A cao ='03'( OO)) 


运算 结果 为 : 


Sno 


2006111121 


【 例 2.10】 查询 选修 了 学 生 2007111001 所 选修 课程 的 学 生 学 号 
Tsoo, cm (SC ) 二 (Acno Gsno = 20071n001'( SC))) 
运算 结果 为 : 
Sno 


2006111121 
2007111001 


人 .5 本 章 小 结 
A 

本 章 系统 地 讲解 了 关系 数据 库 的 重要 概念 ,并 着 重 对 关系 模型 进行 了 描述 。 关 系 模 型 
包括 关系 数据 结构 ,关系 操作 集合 ,以 及 关系 完整 性 约束 三 个 组 成 部 分 。 本 章 还 通过 实例 详 


细 讲 解 了 关系 代数 ,包括 传统 的 并 、 交 、 差 ` 笛 卡 儿 积 集合 操作 和 特殊 的 选择 ,投影 \ 连 接 、 除 
运算 。 


.6 习题 


2.6.1 名 词 解 释 


第 卡 儿 积 关系 元 组 、 域 . 主 码 、 属 性 、 候 选 码 .关系 操 作 、 关 系 模式 、 关 系数 据 库 
2.6.2 简 答题 


1. 简 述 关系 数据 库 的 特点 。 
2. 关系 模型 的 完整 性 约束 有 哪 几 类 ? 
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3. 简 述 等 值 连接 与 自然 连接 的 区 别 与 联系 。 
2.6.3 综合 题 


已 知 一 个 “学 生 课 程 管理 ?数据库 ,其 中 有 三 个 关系 : 

SCSNO, SNAME, CITY) 一 一 供应 商 (编号 .名称 、 城 市 ) 

P(PNO, PNAME, COLOR, WEIGHT) 一 一 零件 (编号 、 名 称 .颜色 .重量 ) 
JGUNO, JNAME, CITY) 一 一 工程 (编号 名称 ,城市 ) 

SPJ(SNO, PNO, JNO, QTY) 一 一 供应 (供应 商 编号 .零件 编号 .工程 编号 .数量 ) 
请 用 关系 代数 表达 式 描述 下 列 查 询问 题 : 

(1) 求 供应 工程 J1 零件 的 供应 商号 码 SNO; 

(2) 求 供应 零件 P1 的 供应 商号 码 SNO; 

(3) 供应 工程 J1 零件 为 红色 的 供应 商号 码 SNO; 

(4) 求 供应 工程 J1 零件 重量 为 50 的 供应 商号 码 SNO; 

(5) 求 供应 工程 J1 零件 为 红色 而 且 重 量 为 50 的 供应 商号 码 SNO; 

(6) 求 至 少 使 用 了 零件 P1 和 零件 P2 的 全 部 工程 号 JNO; 

(7) 求 没有 使 用 天 津 供应 商 生产 的 红色 零件 的 工程 号 JNO。 


关系 数据 库 标 准 语言 SQL | 


结构 化 查询 语言 (Structured Query Language, SQL) 是 关系 数据 库 的 标准 语言 ,其 功能 
包括 定义 查询 ,操纵 和 控制 四 个 方面 。 


@.1 SQL 简介 


SQL 是 1974 年 由 Boyce 和 Chamberlin 提出 的 ,其 前 身 是 SQUARE 语言 。1975 
1979 年 ,IBM 公司 的 San Jose Research Laboratory 研制 出 了 著名 的 关系 数据 库 管理 系统 
原型 System R, 并 实现 了 这 种 语言 。SQL 结构 简洁 ,功能 强大 ,简单 易学 ,所 以 自从 IBM 公 
司 于 1981 年 推出 以 来 ,SQL 得 到 了 广泛 的 应 用 。 如 今 无 论 是 像 Oracle、 Sybase、Informix、 
SQL Server 这 些 大 型 的 数据 库 管理 系统 ,还 是 像 Visual Foxpro PowerBuilder 这 些微 机 上 
常用 的 数据 库 开 发 系统 ,都 支持 以 SQL 作为 查询 语言 。 


3.1.1 SOQL 的 特点 


SQL 集 数据 定义 语言 DDL ,数据 操纵 语言 DML ,数据 控制 语言 DCL 的 功能 于 一 体 , 语 
言 风格 统一 ,可 以 独立 完成 数据 库 生 命 周期 中 的 全 部 活动 ,包括 定义 关系 模式 .录入 数据 以 
建立 数据 库 ,查询 ,更 新 .维护 .数据库 重 构 ,数据 库 安全 性 控制 等 一 系列 操作 ,这 就 为 数据 库 
应 用 系统 开发 提供 了 良好 的 环境 。 例 如 用 户 在 数据 库 投入 运行 后 ,还 可 根据 需要 随时 逐步 
地 修改 模式 ,并 不 影响 数据 库 的 运行 ,从 而 使 系统 具有 良好 的 可 扩展 性 。 


2. 高 度 非 过 程 化 


非 关 系数 据 模型 的 数据 操纵 语言 是 面向 过 程 的 语言 ,用 其 完成 某 项 请 求 ,必须 指定 存 取 
路 径 。 而 用 SQL 进行 数据 操作 ,用 户 只 需 提 出 “做 什么 ”, 而 不 必 指 明 “ 怎 么 做 ”, 因 此 用 户 无 
须 了 解 存 取 路 径 , 存 取 路 径 的 选择 以 及 SQL 语句 的 操作 过 程 由 系统 自动 完成 。 这 不 但 大 大 
减轻 了 用 户 负担 ,而 且 有 利于 提高 数据 独立 性 。 


3. 面向 集合 的 操作 方式 


SQL 采用 集合 操作 方式 ,不 仅 查 找 结 果 可 以 是 元 组 的 集合 ,而 且 一 次 插入 、 删 除 、 更 新 
操作 的 对 象 也 可 以 是 元 组 的 集合 。 
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非 关 系数 据 模型 采用 的 是 面向 记录 的 操作 方式 ， 


任何 一 个 操作 其 对 象 都 是 一 条 记录 。 


例如 查询 所 有 平均 成 绩 在 80 分 以 上 的 学 生 的 姓名 ,用 户 必须 说 明 完成 该 请 求 的 具体 处 理 过 
程 , 即 如 何 用 循环 结构 按照 某 条 路 径 一 条 一 条 地 把 满足 条 件 的 学 生 记 录 读 出 来 。 


4. 以 同一 种 语法 结构 提供 两 种 操作 方式 


SQL 既是 自 含 式 语 言 , 又 是 嵌入 式 语 言 。 作 为 自 
互 的 使 用 方式 ,用 户 可 以 在 终端 键盘 上 直接 输入 SQL 


含 式 语言 , 它 能 够 独立 地 用 于 联机 交 
命令 对 数据 库 进 行 操作 ; 作为 嵌入 式 


语言 ,SQL 语句 能 够 媒人 入 到 高 级 语言 (C、.COBOL、FORTRAN.、PL/SQL 等 ) 程 序 中 , 供 程序 
员 设 计 程 序 时 使 用 。 虽 然 存 在 两 种 不 同 的 使 用 方式 ,但 SQL 的 语法 结构 基本 是 一 致 的 。 这 
种 以 统一 语法 结构 提供 两 种 不 同 使 用 方式 的 做 法 ,为 用 户 提供 了 极 大 的 灵活 性 与 方便 性 。 


5. 语言 简洁 ,易学 易 用 


SQL 功能 极 强 ,但 由 于 设计 巧妙 ,语言 简洁 ,完成 数据 定义 数据 操纵 数据 控制 的 核心 
功能 只 用 了 9 个 动词 : CREATE、 DROP、ALTER、 SELECT, INSERT、 UPDATE、 
DELETE、GRANT、REVOKE, 如 表 3-1 所 示 。 而 且 SQL 语法 简单 ,接近 于 英语 口语 ,因此 


容易 学 习 , 容 易 使 用 。 
表 3-1 SQL 的 动词 及 其 含义 
SQL 功能 SQL 动词 SQL 动词 应 用 对 象 
数据 定义 CREATE.DROP.ALTER 表 、 视 图 .索引 
数据 查询 SELECT 表 、 视 图 
数据 操纵 INSERT UPDATE .DELETE 表 、 视 图 
数据 控制 GRANT REVOKE 数据 库 、 表 


3.1.2 SOL 语言 简介 


SQL 语言 同一 般 的 计算 机 语言 一 样 , 也 由 以 下 几 个 部 分 组 成 。 


1. 常量 


SQL 的 常量 一 般 包 括 文本 常量 (字符 串 )、 整 型 常量 ,数值 常量 等 。 


2. 数据 类 型 
SQL 一 般 包 括 表 3-2 所 列 的 数据 类 型 。 


表 3-2 SQL 的 数据 类 型 


数据 类 型 说 明 符 注 释 
整 型 INT 定 长 16 位 
长 整 型 LONG 定 长 32 位 
十 进 制 数 NUMBERIC( m,n) mm 为 十 进 制 数 ,n 为 小 数 点 位 数 


浮 点 数 FLOAT 


定 长 64 位 ( 双 精 度 ) 
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续 表 
数据 类 型 说 明 符 注 释 
字符 型 ( 定 长 ) CHAR(n) 按 园 定 长 度 存储 字符 串 , 自 动 补充 空格 
变 长 字符 型 VARCHARCz) 按 实际 长 度 存储 字符 串 
日 期 型 DATE 格式 为 : yyyymmdd( 年 月 日 ) 
时 间 型 TIME 格式 为 : hhmmss( 时 分 秒 ) 


不 同 的 数据 库 系统 支持 的 数据 类 型 不 完全 相同 。 例 如 ,IBM DB2 SQL 主要 支持 表 3-3 


所 示 的 数据 类 型 。 
表 3-3 IBM DB2 SQL 主要 支持 的 数据 类 型 
数据 类 型 含 这 
SMALLINT 半 字 长 二 进 制 整数 
INTEGERINT 全 字 长 二 进 制 整数 


DECIMAL( p[ ,gq]) 

或 DEC(p[ ,gq]) 

FLOAT 

CHARTER(m) 或 CHAR(n) 
VARCHAR(n) 
GRAPHIC(n) 
VARGRAPHIC(n) 

DATE 

TIME 

TIMESTAMP 


3. 运算 符 

运算 符 列举 如 下 : 

。 算术 运算 符 : 十 一 、x 、/; 
。 字符 串 运 算 符 : | | (连接 ); 


压缩 十 进 制 数 共 p 位 ,小 数 点 后 
0 过 gp 三 15,g 二 0 时 可 以 省 上 略 
双 字 长 浮 点 数 

长 度 为 n 的 定 长 字符 串 
最 大 长 度 为 n 的 变 长 字符 串 

长 度 为 的 定 长 图 形 字符 串 
最 大 长 度 为 n 的 变 长 图 形 字符 串 
日 期 型 ,格式 为 YYYY-MM-DD 
时 间 型 ,格式 为 HH. MM. SS 
日 期 加 时 间 


。 比较 运算 符 : 一、! = 二 .< 二 ,二 =.<,<=; 


。 逻辑 运算 符 : NOT、AND.\OR; 


。 集合 运算 符 : UNION INTERSECT .MINUS。 


4. 函数 
SQL 提供 了 丰富 函数 ,如 肾 集 函数 等 。 


SQL 的 常量 一 般 包 括 文本 常量 (字符 串 )`. 整 型 常量 ,数值 常量 科 


般 函 数 引用 形式 : 


函数 名 (LDISTINCT/ALL< 表 达 式 二 ]) 。 主 要 的 聚集 函数 将 在 后 文中 介绍 。 


5. 谓词 


SQL 为 了 有 更 强 的 查询 能 力 ,提供 了 一 系列 的 谓词 ,如 BETWEEN… END.IN、 


LIKE 等 。 
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6. 表达 式 
表达 式 是 指 由 一 个 或 多 个 值 .运算 符 和 函数 组 合 而 成 ,并 且 可 以 计算 出 一 个 值 的 式 子 。 
7. 条 件 


条 件 是 指 由 一 个 或 多 个 含有 比较 运算 符 及 逻辑 运算 符 组 合 而 成 的 式 子 , 其 计算 值 是 工 、 
F 或 NULL 的 式 子 。 


8. 命令 


SQL 提供 了 丰富 的 数据 处 理 命令 ,常用 的 有 CREATE .SELECT .INSERT 、DELETE、 
UPDATE GRANT 等 。 


6.2 SQL 数据 定义 功能 


SQL 数据 定义 功能 包括 定义 模式 、 定 义 表 、 定 义 索 引 和 定义 视图 ,其 语句 如 表 3-4 所 示 。 
表 3-4 SQL 的 数据 定义 语句 


SQL 功能 


CREATE SCHEMA | DROP SCHEMA E 
DROP TABLE ALTER TABLE 
DROP VIEW E 


3.2.1 创建 ,删除 模式 

1. 创建 模式 

创建 模式 是 数据 库 中 最 基本 的 操作 ,其 格式 为 : 
CREATE SCHEMA < 模式 名 > AUTHORIZATION < 用 户 名 > 


只 有 获得 了 授权 的 用 户 才能 创建 模式 。 
【 例 3. 1】 用 户 Li 定义 一 个 数据 库 模 式 “ 教 学 管理 ”EM 


CREATE SCHEMA"EM"AUTHORIZATION Li 


如 果 没 有 指定 模式 名 ,那么 模式 名 隐 含 为 用 户 名 ,请 看 下 面 的 例子 。 
【 例 3.2】 用 户 Li 定义 一 个 数据 库 模 式 “Li” 


CREATE SCHEMA AUTHORIZATION Li 
2. 删除 模式 
删除 模式 的 格式 为 : 
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DROP SCHEMA < 模式 名 > < CASCADE | RESTRICT> 


其 中 CASCADE 和 RESTRICT 必 选 其 一 。CASCADE( 级 联 ) 表 示 在 删除 模式 的 同时 
把 模式 中 所 有 的 数据 库 对 象 全 部 一 起 删除 掉 ; RESTRICT( 限 制 ) 表 示 如 果 该 模式 中 已 经 定 
义 了 下 属 的 数据 库 对 象 (如 表 、 视 图 等 ), 则 拒绝 执行 删除 模式 ,只 有 当 模 式 中 没有 任何 数据 
库 对 象 时 才能 删除 模式 。 

【 例 3. 3】 删除 数据 库 模 式 “ 教 学 管理 EM” 同 时 删除 其 中 所 有 的 数据 库 对 象 。 


DROP SCHEMA"EM" CASCADE 


3.2.2 创建 .删除 修改 基本 表 
1. 创建 基本 表 
创建 基本 表 是 数据 库 中 最 基本 的 操作 ,其 格式 为 : 


CREATE TABLE < 基本 表 名 >( 
< 列 名 1> < 数据 类 型 > [ 列 名 1 的 列 级 完整 性 约束 条 件 ] 
[,< 列 名 2> < 数据 类 型 > [ 列 名 2 的 列 级 完整 性 约束 条 件 ] 


,< 列 名 n> < 数据 类 型 > [ 列 名 n 的 列 级 完整 性 约 东 条 件 ]] 
[,< 表 级 完整 性 约束 条 件 1 > 
[,< 表 级 完整 性 约束 条 件 2>] 


[,< 表 级 完整 性 约束 条 件 m>] 

); 

其 中 ,二 表 名 二 是 所 要 定义 的 基本 表 的 名 字 , 它 可 以 由 一 个 或 多 个 属性 ( 列 ) 组 成 。 每 列 
由 列 名 ,数据 类 型 和 列 级 完整 性 约束 条 件 组 成 ,定义 不 同 列 时 用 逗号 隔 开 。 

建 表 的 同时 通常 还 可 以 定义 若干 与 该 表 有 关 的 完整 性 约束 条 件 ,这 些 完整 性 约束 条 件 
被 存 人 系统 的 数据 字典 中 , 当 用 户 操作 表 中 数据 时 由 DBMS 自动 检查 该 操作 是 否 违背 这 些 
完整 性 约束 条 件 。 

【 例 3.4】 建立 一 个 “课程 表 ”C, 它 由 课程 编号 Cno、 名 称 Cname、 学 分 Ceredit、 前 导 课 
程 编号 Cpno 四 个 属性 组 成 。 其 中 课程 编号 不 能 为 空 , 值 是 唯一 的 ,并 且 名 称 取 值 也 是 唯 
一 的 。 


CREATE TABLE C 


( Cno CHAR(3) NOT NULL UNIQUE, /* 列 级 完整 性 约 东 条 件 , Cno 不 空 且 唯一 */ 
Cname CHAR(20) UNIQUE, /* 列 级 完整 性 约 东 条 件 , Cname 唯一 * / 
Cpno CHAR(3), 


Ceredit INT 
); 


系统 执行 上 面 的 CREATE TABLE 语句 后 .就 在 数据 库 中 建立 了 一 个 新 的 空 的 “课程 
表 ”C. 并 将 有 关 “ 课 程 表 ” 的 定义 及 有 关 约 束 条 件 存 放 在 数据 字典 中 。 
定义 表 的 各 个 属性 时 需要 指明 其 数据 类 型 及 长 度 。 
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【 例 3. 5】 建立 一 个 “课程 表 ”C 的 同时 先行 课 是 自身 的 外 码 。 


CREATE TABLE C 


( Cno CHAR(3) PRIMARY KEY, /* 表 级 完整 性 约束 条 件 * / 
Cname CHAR(20) UNIQUE, /* 表 级 完整 性 约束 条 件 * / 
Cpno CHAR(3), 

Ceredit INT, 


FOREIGN KEY (Cpno) REFERENCES C(Cno) /* 表 级 完整 性 约束 条 件 * / 
); 


【 例 3.6】 建立 一 个 “学 生 表 ”S 和 “选修 表 ”SC。 


CREATE TABLE S 


( Sno CHAR(10) PRIMARY KEY, /* 列 级 完整 性 约束 条 件 , Sno 是 主 码 * / 
Ssex CHAR(1), 
Sage INT, 


Sclass CHAR(6) 
); 
CREATE TABLE SC 
( Sno CHAR(10), 
Cno CHAR(3), 
Grade INT, 
PRIMARY KEY( Sno, Cno), 
FOREIGN KEY(Sno)REFERENCES S(Sno), /* 表 级 完整 性 约束 条 件 * / 
FOREIGN KEY (Cno)REFERENCES C(Cno) /* 表 级 完整 性 约束 条 件 * / 
); 


2. 修改 基本 表 
修改 已 建立 好 的 基本 表 , 包 括 增加 新 列 ` 增 加 新 的 完整 性 约束 条 件 、 修 改 原 有 的 列 定 义 


或 删除 已 有 的 完整 性 约束 条 件 等 ,其 一 般 格式 为 : 


ALTER TABLE < 表 名 > 
[ ADD < 新 列 名 > < 数据 类 型 > [完整 性 约束 ] ] 
[ DROP < 完整 性 约束 名 >] 
[ MODIFY < 列 名 > < 数据 类 型 >] ; 


其 中 二 表 名 二 指定 需要 修改 的 基本 表 ; ADD 子 句 用 于 增加 新 列 和 新 的 完整 性 约束 条 


件 ; DROP 子 句 用 于 删除 指定 的 完整 性 约 东 条 件 ; MODIFY 子 句 用 于 修改 原 有 的 列 定义 。 


【 例 3.7】 向 C 表 增加 “课程 类 型 " 列 ,其 数据 类 型 为 定 长 字符 串 。 
ALTER TABLE C ADD Ctype CHAR(16) ; 


不 论 基 本 表 中 原来 是 否 已 有 数据 .新 增加 的 列 一 律 为 空 值 。 
【 例 3.8】 删除 课程 名 称 Cname 必须 取 唯 一 值 的 约束 。 


ALTER TABLE C DROP UNIQUE Cname; 
【 例 3.9】 将 成 绩 的 数据 类 型 改 为 浮 点 型 。 


ALTER TABLE SC MODIFY Grade FLOAT(4); 
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SQL 没有 提供 删除 属性 列 的 语句 ,用 户 只 能 先 将 原 表 中 要 保留 的 列 及 其 内 容 复制 到 一 
个 新 表 中 ,然后 删除 原 表 ,并 将 新 表 重 命名 为 原 表 名 。 


3. 删除 基本 表 

删除 基本 表 的 一 般 格 式 为 : 

DROP TABLE < 表 名 > [<CASCADE | RESTRICT>]; 

缺 省 情况 是 RESTRICT, 表 示 只 有 当 要 删除 的 基本 表 没有 被 其 他 基本 表 的 约束 (如 外 
码 ) 所 引用 ,没有 视图 和 触发 器 、 存 储 过 程 或 函数 时 ,才能 被 删除 。 

CASCADE 则 表示 ,删除 表 时 ,与 之 相关 的 内 容 ( 视 图 、 触 发 器 等 ) 一 起 被 删除 ,因此 应 谨 


慎 使 用 。 
【 例 3.10】 删除 C 表 。 


DROP TABLE C; 


注意 : 不 同 的 数据 库 产品 对 CASCADE 和 RESTRICT 的 处 理会 有 小 小 的 差别 ,需要 针 
对 具体 数据 库 做 具体 了 解 。 


3.2.3 ”创建 .删除 ,修改 索引 


建立 索引 是 加 快 表 的 查询 速度 的 有 效 手段 。 索 引 就 像 书 的 目录 一 样 ,可 以 直接 定位 到 
要 查找 的 内 容 。SQL 语言 支持 用 户 根据 应 用 环境 的 需要 ,在 基本 表 上 建立 一 个 或 多 个 索 
引 , 以 提供 多 种 存 取 路 径 , 加 快 查找 速度 。 


1. 建立 索引 
建立 索引 的 一 般 格式 为 : 


CREATE [UNIQUE] [CLUSTER] INDEX < 索引 名 > 
ON < 表 名 > (< 列 名 1 > [< 次 序 >][,< 列 名 2> [< 次 序 >]]… ); 


其 中 ,二 表 名 二 指定 要 建 索引 的 基本 表 的 名 字 。 索 引 可 以 建 在 该 表 的 一 列 或 多 列 上 ,各 
列 名 之 间 用 逗号 分 隔 。 每 个 二 列 名 过 后面 还 可 以 用 到 次序 二 指定 索引 值 的 排列 次 序 ,包括 
ASC( 升 序 ) 或 DESC( 降 序 ) ,默认 值 为 ASC 。 

UNIQUE 为 唯一 性 索引 ,表示 此 索引 的 每 一 个 索引 值 只 对 应 唯一 的 数据 记录 。 

CLUSTER 为 聚 秘 索 引 , 指 索引 项 的 顺序 与 表 中 记录 的 物理 顺序 一 致 的 索引 组 织 。 例 
如 CREATE CLUSTER INDEX Cname ON CCCname); 将 会 在 表 C 的 Cname 列 建 一 个 聚 
簇 索引 ,而 且 表 中 的 记录 将 按照 Cname 值 的 升序 存放 。 
用 户 可 以 在 最 常 查询 的 列 上 建立 聚焦 索引 以 提高 查询 效率 。 显 然 在 一 个 基本 表 上 最 多 
只 能 建立 一 个 聚焦 索引 。 建 立 聚 能 索引 后 ,更 新 索引 列 数 据 时 ,往往 导致 表 中 记录 的 物理 顺 
序 的 变更 ,代价 较 大 ,因此 对 于 经 常 更 新 的 列 不 宜 建立 聚 簇 索引。 

【 例 3.11】 为 课程 表 C 按 课程 号 升序 建立 唯一 性 索引 。 


CREATE UNIQUE INDEX idxCno ON C(Cno); 
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【 例 3.12】 为 学 生 表 S 按 学 号 升序 建立 聚 簇 索 引 。 


CREATE CLUSTER INDEX CidxSno ON S(Sno); 


2. 删除 索引 
删除 索引 的 一 般 格 式 为 : 


DROP INDEX < 索引 名 >; 


【 例 3.13】 删除 C 表 的 idxCno 索引 。 


DROP INDEX idxCno; 


删除 索引 时 ,系统 会 同时 从 数据 字典 中 删 去 有 关 该 索引 的 描述 。 


@.3 SQL 数据 查询 功能 


SQL 语言 提供 了 SELECT 语句 进行 数据 库 的 查询 ,该 语句 具有 灵活 的 使 用 方式 和 让 
富 的 功能 。 其 一 般 格 式 为 : 

SELECT [ALL | DISTINCT]< 目 标 列表 达 式 >[,< 目 标 列表 达 式 >] … 

FROM < 表 名 或 视图 名 >[,< 表 名 或 视图 名 >]… 

[WHERE < 条 件 表达 式 >] 

[GROUP BY < 列 名 1 >[HAVING < 条 件 表 达 式 >]] 

[ORDER BY < 列 名 2 >[ASC| DESC]]; 

SELECT 语句 的 含义 是 : 根据 WHERE 子 句 的 条 件 表达 式 , 从 FROM 子 句 指定 的 基 
本 表 或 视图 中 找 出 满足 条 件 的 元 组 ,再 按 SELECT 子 句 中 的 目标 列表 达 式 , 选 出 元 组 中 的 
属性 值 形 成 结果 表 。 如 果 有 GROUP 子 句 , 则 将 结果 按 志 列 名 1 二 的 值 进行 分 组 ,该 属性 列 
值 相等 的 元 组 为 一 个 组 。 通 常会 在 每 组 中 使 用 集 函 数 。 如 果 GROUP 子 句 带 HAVING 短 
语 , 则 只 有 满足 指定 条 件 的 组 才 输 出 。 如 果 有 ORDER 子 句 , 则 结果 表 还 要 按 二 列 名 2 二 的 
值 升序 或 降序 排序 。 

在 后 面 的 例题 中 ,将 使 用 到 图 3-1 所 示 的 表 。 


3.3.1 单 表 查询 

1. 选择 表 中 的 若干 列 

(1) 查询 指定 列 

【 例 3.14】 查询 所 有 课程 的 编号 和 名 称 。 


SELECT Cno, Cname 

FROM C; 

可 根据 应 用 的 需要 改变 列 的 显示 顺序 。 
(2) 查询 全 部 列 

【 例 3.15】 查询 所 有 课程 的 详细 信息 。 


表 S 

Sno Sname| Ssex | Sage Sclass 
2007111001 | 张 宇 M 20 CS0701 
2007111002 | 赵 娜 | 下 19 701 
2007111121 | 王 昕 | FE 21 | SEo0601 
2006111121 | 李 伟 | M 20 SE0601 
2009111001 | 张 莉 | FF 18 | MA0901 
2009112001 | 李 彤 | F 19 | MA0901 
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图 3-1 查询 算 例 的 基本 表 


SELECT * 
FROM C; 


(3) 查询 经 过 计算 的 值 
【 例 3.16】 查 全 体 学 生 的 姓名 及 其 出 生年 份 。 


SELECT Sname, 2011 — Sage 


FROM S; 

查询 结果 为 : 
Sname 2011-Sage Sname 2011-Sage 
张 字 1991 李 伟 1991 
赵 娜 1992 张 莉 1993 
王 昕 1990 李 彤 1992 


去 目标 列表 达 式 之 还 可 以 是 字符 串 常 量 、 郴 数 等 ,而且 可 以 通过 指定 别名 来 改变 查询 结 


果 的 列 标题 。 


【 例 3. 17】〗 查询 全 体 学 生 的 姓名 、 出 生年 份 和 所 在 系 ,要 求 用 小 写字 母 表示 所 有 系 名 。 


SELECT Sname NAME, 2011 — Sage BIRTHDATE, LOWER(Sclass) CLASS 


FROM S; 


查询 结果 为 : 
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NAME BIRTHDATE CLASS 
张 宇 1991 cs0701 
赵 娜 1992 cs0701 
王 昕 1990 se0601 
李 伟 1991 se0601 
张 莉 1993 ma0901 
李 彤 1992 ma0901 


2. 选择 表 中 的 若干 元 组 
(1) 消除 取 值 重复 的 行 


两 个 本 来 并 不 完全 相同 的 元 组 ,投影 到 指定 的 某 些 列 上 后 ,可 能 变 成 相同 的 行 了 。 例 如 


查询 选修 了 课程 的 学 生 学 号 ， 


为 某 个 学 生 选 择 了 若干 门 课 ,因此 他 的 学 号 会 重复 出 现 ,如 


果 想 去 掉 结 果 表 中 的 重复 行 ,就 必须 指定 DISTINCT 短语 。 


【 例 3. 18】 


SELECT DISTINCT Sno 
FROM SC; 


查询 选修 了 课程 的 学 生 学 号 。 


如 果 未 指定 DISTINCT 短语 , 则 缺 省 为 ALL, 即 保留 结果 表 中 取 值 重复 的 行 。 


(2) 查询 满足 条 件 的 元 组 


查询 满足 指定 条 件 的 元 组 可 以 通过 WHERE 子 句 来 实现 。WHERE 子 句 常用 的 查询 


条 件 , 如 表 3-5 所 示 。 


表 3-5 常用 的 查询 条 件 


查询 条 件 谓词 
比较 =,>,<,<=,>=,<>,!>,!< 
确定 范围 BETWEEN AND,NOT BETWEEN AND 
确定 集合 IN.NOT IN 
字符 匹配 LIKE.NOT LIKE 
空 值 IS NULL,IS NOT NULL 
多 重 条 件 AND.OR 
@ 比较 大 小 
【 例 3.19】 查询 全 体 男生 的 名 单 。 
SELECT Sname 
FROM S 
WHERE Ssex = 'M'; 
@ 确定 范围 
【 例 3.20】 查询 所 有 年 龄 在 19 一 22 岁 (包括 19 岁 和 22 岁 ) 的 学 生 姓名 及 其 年 龄 。 


SELECT Sname, Sage 
EROM S 


WHERE Sage BETWEEN 19 AND 22; 
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@ 确定 集合 
【 例 3.21】 查询 除了 数据 结构 .计算机 原理 数据 库 原理 以 外 的 课程 编号 和 课程 名 。 
SELECT Cno, Cname 


FROMC 
WHERE Cname NOT IN (' 数 据 结 构 ', ' 计 算 机 原理 ', ' 数 据 库 原理 '); 


@ 字符 匹配 
谓词 LIKE 可 以 用 来 进行 字符 串 的 匹配 ,其 格式 为 : 


[NOT] LIKE '< 匹 配 串 >'[ESCRPE'< 换 码 字符 >'] 


其 含义 是 查找 指定 的 属性 列 值 与 过 匹配 串 之 相 匹配 的 元 组 。 去 匹配 串 之 可 以 为 完整 的 
字符 串 ,也 可 以 含有 通配符 外 和 _。 其 中 : %( 百 分 号 ) 代 表 任 意 长 度 (长 度 可 以 为 0) 的 字符 
串 ; _ 代 表 任 意 单个 字符 。 例 如 a%b 表示 以 a 开头 ,以 b 结尾 的 任意 长 度 的 字符 串 ,asb、 
asdb、aefegb 均 满 足 该 匹配 串 ; a_b 表示 以 a 开头 ,以 b 结尾 的 长 度 为 3 的 任意 字符 串 ,acb、 
asb、azb 满足 该 匹配 串 ,而 asdb、aefegb 不 满足 该 匹配 串 。 

【 例 3.22】 查询 所 有 姓 张 的 学 生 的 姓名 、 学 号 和 性 别 。 

SELECT Sname, Sno, Ssex 


FROM S 
WHERE Sname LIKE ' 张 %'; 


【 例 3.23】 查询 姓名 中 第 二 个 字 为 “ 娜 ”的 学 生 的 姓名 和 学 号 。 

SELECT Sname, Sno 

FROM S 

WHERE Sname LIKE ' 娜 %'; 

名 涉及 空 值 的 查询 

【 例 3.24】 某 些 学 生 选 修 课 程 后 没有 参加 考试 ,所 以 有 选课 记录 ,但 没有 考试 成 绩 。 
查询 有 成 绩 的 学 生 的 学 号 和 相应 的 课程 号 .成 绩 。 

SELECT * 

FROM SC 

WHERE GRADE IS NOT NULL; 

@ 多 重 条 件 

【 例 3.25】 查询 所 有 年 龄 在 20 岁 以 上 (包括 20 岁 ) 的 男 学 生 姓 名 及 其 年 龄 。 


SELECT Sname, Sage FROM S WHERE Sage <= 20 AND Ssex= 'M'; 


3. 对 查询 结果 排序 
【 例 3.26】 查询 选修 了 03 号 课程 的 学 生 的 选课 记录 ,查询 结果 按 分 数 的 降序 排列 。 


SELECT * 

FROM SC 

WHERE Cno = '03" 
ORDER BY Grade DESC; 


“> 数据 库 原理 
【 例 3.27】 查询 全 体 学 生 情况 ,查询 结果 按 所 在 班级 的 升序 排列 ,同一 班 的 学 生 按 年 

龄 降序 排列 。 

SELECT 关 


FROM S 
ORDER BY Sclass, Sage DESC; 


4. 使 用 集 函 数 


为 了 方便 用 户 查 询 ,SQL 提供 了 一 些 集 函 数 , 如 表 3-6 所 示 。 
表 3-6 SQL 提供 的 集 函 数 


集 函数 和 咨 多 
COUNTC* ) 统计 元 组 个 数 
COUNT([DISTINCT | ALL] 一 列 名 之 ) 统计 一 列 中 值 的 个 数 
SUM([DISTINCT | ALL] 一 列 名 过) 计算 一 列 值 的 总 和 (此 必 为 数值 ) 
AVG([DISTINCT | ALL] 一 列 名 之) 计算 一 列 值 的 平均 值 (此 必 为 数值 
MAX([DISTINCT | ALL] 一 列 名 之 ) 求 一 列 值 中 的 最 大 值 
MIN([DISTINCT | ALL] 一 列 名 之 ) 求 一 列 值 中 的 最 小 值 


【 例 3.28】 统计 课程 总 数 。 
SELECT COUNT ( * ) 
FROM C; 


【 例 3.29】 统计 被 学 生 选 择 的 课程 总 数 。 


SELECT COUNT (DISTINCT SNO ) 
FROM SC; 


【 例 3.30】 计算 选修 01 号 课程 的 学 生 的 平均 成 绩 。 


SELECT AVG(Grade) 
FROM SC 
WHERE Cno = '01°; 


【 例 3.31】 查询 选修 01 号 课程 学 生 的 最 高 分 数 。 


SELECT MAX(Grade) 
FROM SC 
WHERE Cno= '01°'; 


5. 对 查询 结果 分 组 


GROUP BY 子 名 可 以 将 查询 结果 表 的 各 行 按 一 列 或 多 列 取 值 相等 的 原则 进行 分 组 。 
对 查询 结果 分 组 的 目的 是 细 化 集 函 数 的 作用 对 象 。 如 果 未 对 查询 结果 分 组 , 集 函 数 将 
作用 于 整个 查询 结果 , 即 整个 查询 结果 只 有 一 个 函数 值 , 如 例 3. 28 一 例 3. 31。 否 则 ,如 果 对 
查询 结果 分 组 , 集 函 数 将 作用 于 每 一 个 组 , 即 每 一 组 都 有 一 个 函数 值 。 
【 例 3.32】 求 每 门 课程 的 平均 分 。 
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SELECT Cno, AVG(Grade) 
FROM SC 
GROUP BY Cno; 


【 例 3. 33〗 查询 学 生 选 修 课 程 超过 3 人 的 课程 编号 。 


SELECT Cno 

FROM SC 

GROUP BY Cno 

HAVING COUNT( * )>= 3; 


注意 : WHERE 与 HAVING 有 区 别 , 它 们 的 作用 对 象 不 同 。WHERE 作用 于 基本 表 
或 视图 ,从 中 选择 满足 条 件 的 元 组 ; HAVING 作用 于 组 ,从 中 选择 满足 条 件 的 组 。 
3.3.2 连接 查询 


若 一 个 查询 同时 涉及 两 个 以 上 的 表 , 则 称 之 为 连接 查询 。 连 接 查 询 实际 上 是 关系 数据 
库 中 最 主要 的 查询 ,主要 包括 等 值 连接 , 非 等 值 连接 .自然 连接 .自身 连接 .外 连接 和 复合 条 
件 连 接 查 询 。 

1. 等 值 与 非 等 值 连 接 查 询 

连接 条 件 写 在 WHERE 子 句 中 ,格式 为 : 

[ 表 名 1. ]< 列 名 1 >< 比 较 运算 符 > [ 表 名 2.] < 列 名 2> 

比较 运算 符 包括 =、! =、 >、>= 二 二 =。 如 果 比 较 运 算 符 为 =, 则 称 为 等 值 连接 ， 


否则 称 为 非 等 值 连接 。 
【 例 3. 34】〗 查询 每 个 学 生 及 其 选修 课程 的 情况 。 


SELECT S. *, SC. * 


FROM S, SC 

WHERE S. Sno = SC. Sno; 

该 查询 的 执行 结果 为 : 

S. Sno Sname Ssex Sage Sclass SC. Sno Cno Grade 
2007111001 张 字 M 20 CS0701 2007111001 3 64 
2007111001 张 字 M 20 CS0701 2007111001 5 81 
2007111001 张 宇 M 20 CS0701 2007111001 6 72 
2006111121 王 昕 F 21 SE0601 2006111121 六 92 
2006111121 王 昕 F 21 SE0601 2006111121 3 85 
2006111121 王 昕 F 21 SE0601 2006111121 5 87 
2006111121 王 昕 F 狐 SE0601 2006111121 5 95 
2009112001 李 形 F 19 MA0901 2009112001 1 79 
2009112001 李 彤 F 19 MA0901 2009112001 2 86 


连接 运算 有 两 种 特殊 情况 : 广义 笛 卡 儿 积 连接 和 自然 连接 。 
两 个 表 的 广义 稍 卡 儿 积 连接 为 两 表 中 元 组 的 交叉 乘积 ,结果 会 产生 一 些 没有 意义 的 元 
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组 ,实际 很 少 使 用 。 若 在 等 值 连接 中 把 目标 列 中 重复 的 属性 列 去 掉 则 为 自然 连接 。 例 3. 34 可 
自然 连接 完成 如 下 : 


SELECT S. Sno, Sname, Ssex, Sage, Sclass, Cno, Grade 
FROM S, SC 
WHERE S. Sno = SC. Sno; 


2. 自身 连接 

连接 操作 不 仅 可 以 在 两 个 表 之 间 进 行 , 也 可 以 是 一 个 表 与 自己 进行 连接 , 称 为 表 的 自身 
【 例 3.35】〗 查询 每 一 门 课 的 间接 先行 课 ( 即 先 行 课 的 先行 课 ) 。 

为 C 表 取 两 个 别名 ,FIRST SECOND ,完成 该 查询 的 SQL 语句 为 : 


SELECT FIRST. Cno，SECOND. Cpno 
FROM C FIRST，C SECOND 
WHERE FIRST. Cpno = SECOND. Cno AND SECOND. CPno IS NOT NULL; 


该 查询 的 执行 结果 为 : 
Cno Cpno Cno Cpno 
03 01 07 02 
05 02 08 03 
3. 外 连接 


在 通常 的 连接 操作 中 ,只 有 满足 连接 条 件 的 元 组 才能 作为 结果 输出 。 如 例 3. 34 的 结果 
表 中 没有 学 生 2007111002 的 信息 。 如 果 想 以 S 表 为 主体 , 列 出 每 个 学 生 的 基本 情况 及 其 选 
课 情况 , 若 某 个 学 生 没 有 选课 ,只 输出 其 基本 情况 信息 ,其 选课 信息 为 空 值 即 可 ,就 需要 使 用 
外 连接 (OUTER JOIN)。 可 以 如 下 改写 例 3. 34: 

SELECT S. Sno, Sname, Ssex, Sage, Sclass, Cno, Grade 


FROM S LEFT OUTER JOIN SC 
ON S. Sno = SC. Sno; 


外 连接 的 表示 方法 为 : 加 入 关键 字 “ 表 1 LEFT/RIGHT OUTER JOIN 表 2 ON 谓词 
外 连接 就 好 像 是 为 符号 * 所 在 边 的 表 增 加 一 个 “万 能 ”的 行 , 这 个 行 全 部 由 空 值 组 成 , 它 
可 以 和 另 一 边 的 表 中 所 有 不 满足 连接 条 件 的 元 组 进行 连接 。 


执行 结果 如 下 : 

Sno Sname Ssex Sage Sclass Cno Grade 
2007111001 张 宇 M 20 CS0701 06 72 
2007111001 张 宇 M 20 CS0701 05 81 
2007111001 张 宇 M 20 CS0701 03 64 
2007111002 赵 娜 1 19 CS0701 NULL NULL 
2006111121 王 昕 到 21 SE0601 05 95 
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续 表 
Sno Sname Ssex Sage Sclass Cno Grade 
2006111121 王 昕 F 21 SE0601 05 87 
2006111121 王 昕 果 21 SE0601 03 85 
2006111121 王 昕 R 21 SE0601 02 92 
2006111122 李 伟 M 20 SE0601 NULL NULL 
2009111001 张 莉 F 18 MA0901 NULL NULL 
2009112001 李 彤 F 19 MA0901 02 86 
2009112001 李 彤 F 19 MA0901 01 79 
4. 复合 条 件 连接 


WHERE 子 句 中 可 以 有 多 个 连接 条 件 , 称 为 复合 连接 条 件 。 
【 例 3. 36〗 查询 选修 02 号 课程 且 成 绩 在 90 分 以 上 的 所 有 学 生 。 
SELECT S. Sno, Sname 


FROM S，SC 
WHERE S. Sno = SC. Sno AND SC. Cno = '02' AND SC. Grade > 90; 


连接 操作 除了 可 以 是 两 表 连 接 或 一 个 表 自 身 连接 外 ,还 可 以 是 两 个 以 上 的 表 进 行 连接 ， 
即 多 表 连 接 。 

【 例 3.37】 查询 每 个 学 生 的 学 号 、 姓 名 、 选 修 的 课程 及 成 绩 。 

SELECT S. Sno, Sname, Cname, Grade 


FROM S, SC, C 
WHERE S. Sno = SC. Sno AND SC. Cno = C. Cno; 


3.3.3 髓 套 查询 


在 SQL 中 ,一 个 SELECT-FROM-WHERE 称 为 一 个 查询 块 。 将 一 个 查询 块 嵌 套 在 另 
一 个 查询 块 的 WHERE 子 句 或 HAVING 短语 的 条 件 中 的 查询 称 为 幅 套 查询 。 

【 例 3.38】 查询 学 号 为 *2006111121” 的 学 生 选 修 的 课程 名 称 。 

SELECT Cname 

FROMC 

WHERE Cno IN (SELECT Cno 


FROM SC 
WHERE Sno = ' 2006111121'); 


上 层 的 查询 块 称 为 外 层 查询 或 父 查询 ,下 层 查 询 块 称 为 内 层 查询 或 子 查询 。 例 3. 38 
中 ,SELECT Cno FROM SC WHERE Sno 二 '2006111121' 为 子 查询 。SQL 允许 多 层 嵌 套 查 
询 。 另 外 , 子 查询 的 SELECT 语句 中 不 能 使 用 ORDER BY 子 句 ,ORDER BY 子 句 只 能 对 
最 终 查 询 结果 排序 。 

嵌 套 查询 一 般 的 求解 方法 是 由 里 向 外 处 理 , 即 每 个 子 查 询 在 上 一 级 查询 处 理 之 前 求解 。 
子 查询 的 结果 用 于 建立 其 父 查询 的 查找 条 件 。 
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嵌 套 查询 使 多 个 简单 查询 构成 了 复杂 查询 ,从 而 增强 了 SQL 的 查询 能 力 。 
1. 带 有 IN 谓词 的 子 查询 


【 例 3.39】 查询 以 “程序 设计 基础 "为 先行 课 的 课程 。 
分 步 查询 : 

@ 确定 “程序 设计 基础 "的 课程 编号 ; 

SELECT Cno 


FROM C 
WHERE Cname = ' 程 序 设计 基础 '; 


结果 为 : '02' 
@ 查找 所 有 以 '02' 为 先行 课 的 课程 。 


SELECT * 
FROM C 
WHERE Cpno = '0277 


使 用 IN 的 向 套 查 询 : 


SELECT * 

FROMC 

WHERE Cpno IN 

(SELECT Cno 

FROMC 

WHERE Cname = ' 程 序 设 计 基 础 '); 


结果 为 : 


Ceredit 


数据 结构 


DBMS 求解 嵌 套 时 也 是 分 步 执 行 的 ,类 似 于 分 步 查 询 , 即 首先 确定 “程序 设计 基础 "的 
课程 编号 ,然后 求解 父 查询 ,查找 所 有 以 '03' 为 先行 课 的 课程 。 

本 例 中 的 查询 也 可 以 用 自身 连接 来 完成 : 

SELECT FIRST. 关 


FROM C FIRST，C SECOND 
WHERE SECOND. Cname = ' 程 序 设计 基础 ' AND FIRST. Cpno = SECOND. Cno; 


本 例 中 父 查询 和 子 查询 均 引 用 了 C 表 , 可 以 像 自身 连接 那样 用 别名 将 父 查询 中 的 C 表 
与 子 查询 中 的 C 表 区 分 开 ， 

SELECT * 

EROM C C1 


WHERE C1. Cpno IN 
(SELECT Cno FROM C C2 WHERE C2. Cname = ' 程 序 设计 基础 '); 


【 例 3.40】 查询 选修 了 课程 名 为 “程序 设计 基础 ”的 学 生 。 
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SELECT 关 
FROM S 
WHERE Sno IN 

(SELECT Sno 

FROM SC 

WHERE Cno IN 

(SELECT Cno FROM C WHERE Cname = ' 程 序 设计 基础 ')); 
结果 为 : 
Sno Sname Ssex Sage Sclass 

2006111121 王 昕 F 21 SE0601 
2009112001 李 彤 F 19 MAO901 


本 查询 同样 可 以 用 连接 查询 来 实现 : 

SELECT S. * 

FROMS, SC, C 

WHERE S. Sno = SC. Sno AND SC. Cno = C. Cno AND 

C.Cname = ' 程 序 设计 基础 '; 

查询 涉及 多 个 关系 时 ,用 嵌 套 查询 逐步 求解 ,层次 清楚 ,易于 构造 ,具有 结构 化 程序 设计 
的 优点 。 

例 3. 39 和 例 3.40 中 的 各 个 子 查 询 都 只 执行 一 次 ,其 结果 用 于 父 查询 。 子 查询 的 查询 
条 件 不 依赖 于 父 查询 ,这 类 子 查 询 称 为 不 相关 子 查 询 。 不 相关 子 查询 是 最 简单 的 一 类 子 
查询 。 


2. 带 有 比较 运算 符 的 子 查询 


带 有 比较 运算 符 的 子 查询 是 指 父 查询 与 子 查询 之 间 用 比较 运算 符 进行 连接 。 当 用 户 能 
确切 知道 内 层 查 询 返 回 的 是 单 值 时 ,可 以 用 二 ,二 ,二 ,这 二 ,= 二、! 二 或 二 二 等 比较 运算 符 。 
例如 : 


SELECT Sno, Sname, Sclass 
EROM S 
WHERE Sclass = 
(SELECT Sclass 
FROM S 
WHERE Sname = ' 王 昕 '); 


注意 : 子 查询 一 定 要 跟 在 比较 运算 符 之 后 ,下 面 的 SQL 语句 是 错误 的 : 


SELECT Sno, Sname, Sclass 
FROM S 
WHERE (SELECT Sclass 
FROM S 
WHERE Sname = ' 王 昕 ') = Sclass; 


3.3.4 集合 查询 


SELECT 语句 的 查询 结果 是 元 组 的 集合 ,所 以 多 个 SELECT 语句 的 结果 可 进行 集合 操 
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作 。 集 合 操作 主要 包括 并 操作 UNION 、 交 操作 INTERSECT 和 差 操 作 MINUS。 


【 例 3.41】 查询 计 科 0701 班 的 学 生 及 年 龄 小 于 20 岁 的 学 生 。 


SELECT * 

FROM S 

WHERE Sclass = 'CS0701' 
UNION 

SELECT * 

FROM S 

WHERE Sage < 20; 


使 用 UNION 将 多 个 查询 结果 合并 起 来 时 ,系统 会 自动 去 掉 重复 元 组 。 
注意 : 参加 UNION 操作 的 各 结果 表 的 列 数 必须 相同 ; 对 应 项 的 数据 类 型 也 必须 


相同 。 


标准 SQL 中 没有 直接 提供 集合 交 操作 和 集合 差 操 作 , 但 可 以 用 其 他 方法 来 实现 。 如 


例 3. 41 可 以 用 下 面 的 SELECT 语句 来 实现 : 


SELECT * FROM S WHERE Sclass like 'CS %'OR Sage<20; 


【 例 3.42】 查询 选修 课程 03 的 学 生 集合 与 选修 课程 05 的 学 生 集 合 的 交集 。 


SELECT Sno 

FROM SC 

WHERE Cno = '03"' 
INTERSECT 
SELECT Sno 

FROM SC 

WHERE Cno = '05°'; 


可 以 用 下 面 的 SELECT 语句 实现 : 


SELECT Sno 

FROM SC 

WHERE Cno = '03' AND Sno IN 
(SELECT Sno 
FROM SC 
WHERE Cno = '05°); 


【 例 3.43】 查询 计 科 0701 班 的 学 生 与 年 龄 小 于 20 岁 的 学 生 的 差 集 。 
本 查询 换 种 说 法 就 是 ,查询 计 科 0701 班 中 年 龄 大 于 20 岁 ( 含 20 岁 ) 的 学 生 。 
SELECT * 


FROMS 
WHERE Sclass = ' CS0701'AND Sage > 20; 


在 使 用 SELECT 语句 进行 查询 时 ,要 注意 以 下 几 点 : 

(1) SQL 中 表 名 的 顺序 ,条 件 的 顺序 无 所 谓 , 可 以 任意 调换 。 

(2) WHERE 子 句 中 的 查询 条 件 包括 连接 条 件 和 选择 条 件 。 

(3) 子 查询 可 以 转化 为 多 表 的 连接 查询 ,而 连接 查询 不 一 定 能 用 子 查 询 实 现 。 
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6.4 SQL 数据 操纵 功能 


SQL 数据 操纵 功能 包括 对 基本 表 和 视图 的 操纵 ,本 节 将 详细 介绍 对 基本 表 的 数据 操纵 
功能 ,而 对 视图 数据 的 操纵 功能 将 在 3. 5 节 介 绍 。 
SQL 中 ,对 基本 表 的 数据 操纵 功能 是 指 对 基本 表 中 数据 的 插入 、 修 改 和 删除 。 


3.4.1 插入 数据 


SQL 的 数据 插入 语句 INSERT 有 两 种 形式 : 一 种 是 插入 一 个 元 组 , 另 一 种 是 插入 子 查 
询 结果 。 


1. 插入 单个 元 组 
INSERT 语句 的 格式 为 : 


INSERT 

INTO < 表 名 >[ (< 列 名 >, [< 列 名 >… ])] 

VALUES (< 常量 >[ ,< 常量 >] … ); 

其 功能 为 将 VALUES 后 面 的 数据 插入 到 指定 表 中 。 如 果 INTO 子 句 中 没有 指明 任何 
列 名 , 则 新 插入 的 记录 必须 在 每 个 属性 列 上 均 有 值 。 如 果 INTO 子 句 指明 了 列 名 , 则 新 记 
录 在 未 出 现 的 属性 列 上 取 空 值 , 定 义 时 指明 为 NOT NULL 的 属性 列 不 能 为 空 值 。 

【 例 3.44】 将 一 个 新 课程 记录 插入 到 C 表 中 。 

INSERT 


INTO C 
VALUES ('09', ' 计 算 机 图 形 学 '，"'，3); 


【 例 3.45】 插入 一 条 选课 记录 。 


INSERT 
INTO SC(Sno, Cno) 
VALUES ( '2007111001 "09' ) 


2. 插入 子 查询 结果 


子 查询 不 仅 可 以 典 套 在 SELECT 语句 中 ,用 以 构造 父 查询 的 条 件 , 也 可 以 嵌 套 在 
INSERT 语句 中 ,用 以 生成 要 插入 的 批量 数据 。 

插入 子 查询 结果 的 INSERT 语句 的 格式 为 : 

INSERT 

INTO < 表 名 >[ (< 列 名 >, [< 列 名 >…])] 

子 查询 ; 

【 例 3. 46】 对 每 一 个 班 ,求学 生 的 平均 年 龄 ,并 把 结果 存 和 数据库。 

@ 先 建立 一 新 表 Classage; 
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CREATE TABLE Classage( 
Sclass CHAR(15), 
Avgage SMALLINT); 


加 按 班 分 组 求 出 平均 年 龄 ,再 将 系 名 和 平均 年 龄 插入 新 表 Deptage。 


INSERT INTO Classage (Sclass, Avgage) 
SELECT Sclass，RVG(Sage) FROM S 
GROUP BY Sclass; 


3.4.2 修改 数据 
修改 数据 语句 的 一 般 格式 为 : 


UPDATE 表 名 

SET < 列 名 > = < 表达 式 >[ ,< 列 名 > =< 表 达 式 >] … 

WHERE 条 件 ]; 

其 功能 为 修改 指定 表 中 满足 WHERE 子 句 条 件 的 元 组 。 其 中 SET 子 句 给 出 二 表达 式 二 
目 于 取代 相应 的 属性 列 值 。 如 果 省 略 WHERE 子 句 , 则 表示 要 修改 表 中 的 所 有 元 组 。 


1. 修改 某 一 个 元 组 的 值 
【 例 3. 47〗 将 学 生 2007111001 的 年 龄 改 为 21 岁 。 


UPDATE S 
SET Sage = 21 
WHERE Sno = '2007111001'; 


2. 修改 多 个 元 组 的 值 
【 例 3. 48〗 将 所 有 学 生 的 年 龄 增加 1 岁 。 


UPDATE S 


SET Sage = Sage+1; 


3. 带子 查询 的 修改 语句 


子 查询 也 可 以 嵌 套 在 UPDATE 语句 中 ,用 以 构造 修改 的 条 件 。 
【 例 3.49】 将 计 科 0701 班 全 体 学 生 的 成 绩 置 零 。 
UPDATE SC 
SET Grade=0 
WHERE Sno in( 
Select SC. Sno from SC, S 
WHERE SC. Sno = S. Sno AND Sclass = 'CS0701°'); 


3.4.3 删除 数据 
删除 数据 语句 的 一 般 格式 为 : 
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DELETE 
FROM < 表 名 > 
[WHERE < 条 件 >]; 
其 功能 为 从 指定 表 中 删除 满足 WHERE 子 句 条 件 的 所 有 元 组 。 如 果 省 略 WHERE 子 
句 , 则 表示 删除 表 中 全 部 元 组 。 


1. 删除 某 个 元 组 的 值 
【 例 3.50】 删除 课程 号 为 '02' 的 课程 记录 。 


DELETE 
EROM C 
WHERE Cno = '02°'; 


2. 删除 多 个 元 组 的 值 
【 例 3.51】 删除 所 有 选课 记录 。 


DELETE 
FROM SC; 


3. 带子 查询 的 删除 语句 


子 查询 同样 也 可 以 嵌 套 在 DELETE 语句 中 ,用 以 构造 执行 删除 操作 的 条 件 。 
【 例 3.52】 删除 所 有 课程 名 称 为 “计算 机 图 形 学 ”的 选课 记录 。 
DELETE FROM SC 
WHERE Cno IN 
( SELECT SC. Cno 
FROM C, SC 
WHERE Cname = "计算 机 图 形 学 ' AND SC. Cno = C. Cno 
) 


4. 更 新 操作 与 数据 库 的 一 致 性 


增删 改 操作 只 能 对 一 个 表 操 作 ,这 会 带 来 一 些 问题 。 例 如 ,学 生 2007111001 被 删除 后 ， 
有 关 其 选课 信息 也 应 同时 删除 。 

@ 删除 学 生 2007111001: 

DELETE 


FROM S 
WHERE Sno = '2007111001'7 


@ 删除 学 生 2007111001 的 选课 记录 


DELETE 
FROM SC 
WHERE Sno = '2007111001'; 
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6.5 视图 


视图 是 从 一 个 或 几 个 基本 表 ( 或 视图 ) 导 出 的 表 , 与 基本 表 不 同 ,视图 是 一 个 虚 表 。 数 据 
库 中 只 存放 视图 的 定义 ,而 不 存放 视图 对 应 的 数据 ,这 些 数 据 仍 存放 在 原来 的 基本 表 中 。 所 
以 基本 表 中 的 数据 发 生变 化 ,从 视图 中 查询 出 的 数据 也 就 随 之 改变 了 。 

视图 一 经 定义 ,就 可 以 和 基本 表 一 样 被 查询 ,被 删除 ,可 以 在 一 个 视图 之 上 再 定义 新 的 视图 。 


3.5.1 定义 和 删除 视图 
1. 建立 视图 


CREATE VIEW < 视图 名 > [(< 列 名 >[,< 列 名 >] … )] 

AS< 于 查询 > 

[WITH CHECK OPTION] ; 

其 中 , 子 查询 可 以 是 任意 复杂 的 SELECT 语句 ,但 通常 不 允许 含有 ORDER BY 子 句 
和 DISTINCT 短语 。 

WITH CHECK OPTION 表示 对 视图 进行 INSERT UPDATE 和 DELETE 操作 时 要 
保证 插入 、 修 改 或 删除 的 记录 满足 视图 定义 中 的 谓词 条 件 ( 即 子 查询 中 的 条 件 表达 式 ) 。 

组 成 视图 的 属性 列 名 或 者 全 部 省 略 或 者 全 部 指定 。 如 果 省 略 了 视图 的 各 个 属性 列 名 ， 
则 隐 含 该 视图 由 子 查 询 中 SELECT 子 句 目标 列 中 的 所 有 字段 组 成 。 但 在 下 列 三 种 情况 下 
必须 明确 指定 组 成 视图 的 所 有 列 名 : 

。 某 个 目标 列 不 是 单纯 的 属性 名 ,而 是 集 函 数 或 列表 达 式 。 

。 多 表 连 接 时 选 出 了 几 个 同名 列 作为 视图 的 字段 。 

。 需要 在 视图 中 为 某 属 性 列 使 用 新 的 更 合适 的 名 字 。 

(1) 行列 子 集 视 图 

若 一 个 视图 是 从 单个 基本 表 导 出 的 ,并 且 只 是 去 掉 了 基本 表 的 某 些 行 和 某 些 列 ,但 保留 
了 码 , 则 称 这 类 视图 为 行列 子 集 视图 。 

【 例 3.53】 建立 计 科 0701 班 学 生 的 视图 ,并 要 求 在 进行 修改 和 插入 操作 时 仍 需 保证 
该 视图 中 只 有 计算 机 系 的 学 生 。 


CREATE VIEW CS_S 
RS 
SELECT Sno, Sname, Sage 
FROM S 
WHERE Sclass = 'CS0701" 
WITH CHECK OPTION; 


DBMS 执行 CREATE VIEW 语句 的 结果 只 是 把 视图 的 定义 存 和 人 数据 字典 ,并 不 执行 
其 中 的 SELECT 语句 。 只 是 在 对 视图 查询 时 , 才 按 视图 的 定义 从 基本 表 中 将 数据 查 出 。 

(2) 由 视图 导出 的 视图 

视图 不 仅 可 以 建立 在 一 个 或 多 个 基本 表 上 ,还 可 以 建立 在 一 个 或 多 个 已 经 定义 的 视图 上 。 
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【 例 3.54】 建立 计 科 0701 班 选 修了 03 号 课程 的 学 生 的 视图 。 


CREATE VIEW CS_S1 (Sno, Sname, Grade) 
RS 
SELECT S. Sno, Sname, Grade 
FROM CS_S, SC 
WHERE Sclass = 'CS0701' AND CS_S. Sno = SC. Sno RND SC. Cno = '03'; 


(3) 带 虚拟 列 的 视图 
定义 基本 表 时 ,为 了 减少 数据 库 中 的 宛 余数 据 , 表 中 只 存放 基本 数据 ,由 基本 数据 经 过 


各 种 计算 派生 出 的 数据 一 般 是 不 存储 的 。 但 由 于 视图 中 的 数据 并 不 实际 存储 ,因此 定义 视 
图 时 可 以 根据 应 用 的 需要 ,设置 一 些 派生 属性 列 。 这 些 派 生 属性 列 由 于 在 基本 表 中 并 不 实 


际 存在 ,因此 也 称 它们 为 虚拟 列 。 带 虚拟 列 的 视图 也 称 为 带 表 达 式 的 视图 。 


【 例 3. 55】 定义 一 个 反映 学 生出 生年 份 的 视图 。 


CREATE VIEW BS(Sno, Sname, Sbirth) 
RS 
SELECT Sno, Sname, 2011 — Sage 
FROM S; 


BS 视图 是 一 个 带 表 达 式 的 视图 。 视 图 中 的 出 生年 份 值 是 通过 计算 得 到 的 。 
(4) 带 有 集 函 数 的 视图 
还 可 以 用 带 有 集 函 数 和 GROUP BY 子 句 的 查询 来 定义 视图 ,这 种 视图 称 为 分 组 视图 。 
【 例 3. 56】〗】 将 学 生 的 学 号 及 他 们 的 平均 成 绩 定义 为 一 个 视图 。 
CREATE VIEW S_G( Sno, Gavg) 
AS 

SELECT Sno, AVG(Grade) 

FROM SC 

GROUP BY Sno; 
2. 删除 视图 
格式 : 


DROP VIEW < 视图 名 >; 


视图 删除 后 视图 的 定义 将 从 数据 字典 中 删除 ,但 由 该 视图 导出 的 其 他 视图 定义 仍 在 数 


据 字 典 中 ,但 已 经 失效 ,不 能 继续 使 用 ,应 该 将 它们 一 一 删除 。 


【 例 3.57】 若 删 除 例 3. 53 中 的 视图 CS_S 就 应 该 删除 例 3. 54 中 的 视图 CS_S1。 


DROP VIEW CS_S1; 
DROP VIEW CS_S; 


3.5.2 查询 视图 


视图 定义 后 ,用 户 就 可 以 像 对 基本 表 一 样 对 视图 进行 查询 了 。 
【 例 3. 58】〗 在 计 科 0701 班 学 生 的 视图 中 找 出 年 龄 小 于 20 岁 的 学 生 。 
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SELECT Sno, Sage FROM CS_S WHERE Sage <20; 


DBMS 执行 对 视图 的 查询 时 ,首先 进行 有 效 性 检查 ,检查 查询 的 表 、 视 图 等 是 否 存 在 。 
如 果 存 在 , 则 从 数据 字典 中 取出 视图 的 定义 ,把 定义 中 的 子 查询 和 用 户 的 查询 结合 起 来 , 转 
换 成 等 价 的 对 基本 表 的 查询 ,然后 再 执行 修正 后 的 查询 。 这 一 转换 过 程 称 为 视图 消解 。 

【 例 3.59】 转换 后 的 查询 语句 为 : 


SELECT Sno Sage FROM S WHERE Sclass = 'CS0701' AND Sage <20; 


在 一 般 情况 下 ,视图 查询 的 转换 是 直截了当 的 。 但 在 有 些 情况 下 ,这 种 转换 不 能 直接 进 
行 ,查询 时 就 会 出 现 问题 。 

【 例 3.60】 在 S_G 视图 中 查询 平均 成 绩 在 90 分 以 上 的 学 生 学 号 和 平均 成 绩 。 

SELECT * 


FROM S_G 
WHERE Gavg>= 90; 


将 上 面 查询 语句 与 子 查询 结合 ,形成 下 列 查询 语句 。 


SELECT Sno, AVG(Grade) 
FROM SC 

WHERE AVG(Grade)>= 90 
GROUP BY Sno; 


前 面 讲 过 分 组 后 WHERE 子 句 中 不 能 用 集 函 数 作 为 条 件 表达 式 , 因 此 执行 此 修正 后 的 
查询 将 会 出 现 语法 错误 。 正 确 的 查询 语句 应 该 是 : 

SELECT Sno, AVG(Grade) 

FROM SC 

GROUP BY Sno 

HAVING AVG(Grade)> = 90; 

目前 ,多 数 关系 数据 库 系统 对 行列 子 集 视 图 的 查询 均 能 进行 正确 转换 ,但 对 非 行列 子 集 
的 查询 就 不 一 定 能 做 转换 了 ,因此 这 类 查询 应 该 直接 对 基本 表 进 行 。 


3.5.3 更 新 视图 


由 于 视图 是 不 实际 存储 数据 的 虚 表 ,因此 对 视图 的 更 新 最 终 要 转换 为 对 基本 表 的 更 新 。 
为 防止 用 户 通过 视图 对 数据 进行 增加 、 删 除 \ 修 改 时 ,有 意 无 意 地 对 不 属于 视图 范围 内 的 基 
本 表 数 据 进行 操作 ,可 在 定义 视图 时 加 上 WITH CHECK OPTION 子 句 。 这 样 在 视图 上 
增删 改 数据 时 ,DBMS 会 检查 视图 定义 中 的 条 件 , 若 不 满足 条 件 , 则 拒绝 执行 该 操作 。 


1. 插入 视图 数据 


【 例 3. 61】 将 计 科 0701 班 学 生 视 图 CS_S 中 学 号 为 2007111001 的 学 生 的 姓名 改 为 “张强 ”。 


UPDATE CS_S 
SET Sname = ' 张 强 ' 
WHERE Sno = '2007111001'; 
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转换 后 的 更 新 语句 为 : 


UPDATE S 
SET Sname = ' 张 强 ' 
WHERE Sno = '2007111001' AND Sclass = 'CS0701'; 


2. 删除 视图 数据 
【 例 3.62】 向 计 科 0701 班 学 生 视图 CS_S 中 插入 一 个 新 的 学 生 记录 。 


INSERT INTO CS_S 
VALUES( '2007111003', ' 王 欢 ',20); 


转换 为 对 基本 表 的 更 新 : 


INSERT INTO S(Sno, Sname, Sage, Sclass) 
VALUES( '2007111003'，' 王 欢 '，20, 'CS0701'); 
系统 自动 将 班级 名 'CS0701' 放 入 VALUES 子 句 中 . 


3. 修改 视图 数据 
【 例 3. 63】 删除 计 科 0701 班 学 生 视图 CS_S 中 学 号 为 2007111003 的 记录 。 


DELETE FROM CS_S 
WHERE Sno = ' 2007111003'; 


转换 为 对 基本 表 的 更 新 : 


DELETE FROM S 
WHERE Sno = '2007111003' AND Sclass = 'CS0701'; 


在 关系 数据 库 中 ,并 不 是 所 有 的 视图 都 是 可 更 新 的 ,因为 有 些 视图 的 更 新 不 能 唯一 地 有 


意义 地 转换 成 对 相应 基本 表 的 更 新 。 


例如 前 面 定义 的 视图 S_G 是 由 “学 号 "和 "平均 成 绩 ” 两 个 属性 列 组 成 的 ,其 中 平均 成 绩 


一 项 是 由 S 表 中 对 元 组 分 组 后 计算 平均 值得 来 的 。 如 果 想 把 视图 S_G 中 学 号 为 
2007111001 的 学 生 的 平均 成 绩 改 成 90 分 , 则 SQL 语句 如 下 : 


UPDATE S_G 
SET Gavg = 90 
WHERE Sno = '2007111001'; 


但 这 个 对 视图 的 更 新 是 无 法 转换 成 对 基本 表 的 更 新 的 。 因 为 系统 无 法 修改 各 科 成 绩 ， 


以 使 平均 成 绩 为 90, 所 以 S_G 视图 是 不 可 更 新 的 。 一 般 地 ,行列 子 集 视图 是 可 更 新 的 , 除 行 
列子 集 视图 外 ,还 有 一 些 视图 理论 上 是 可 更 新 的 。 


€.6 数据 控制 


数据 控制 也 称 为 数据 保护 ,包括 数据 的 安全 性 控制 .完整 性 控制 、 并 发 控制 和 恢复 。 关 


于 数据 保护 的 概念 将 在 第 4 章 中 详细 介绍 ,本 节 主 要 介绍 SQL 的 数据 控制 功能 。 
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数据 库 的 安全 性 是 指 保护 数据 库 , 防 止 不 合法 的 使 用 所 造成 的 数据 泄露 和 破坏 。 数 据 


库 系统 中 保证 数据 安全 性 的 主要 措施 是 进行 存 取 控制 , 即 规定 不 同 用 户 对 不 同 数据 对 象 所 
允许 的 执行 操作 ,并 规定 用 户 只 能 存 取 其 权限 内 的 数据 。 


3.6.1 授权 


SQL 使 用 GRANT 语句 授予 用 户 权 限 , 其 一 般 格 式 为 : 


GRANT < 权限 >[ ,< 权限 >] … 
[ON < 对 象 类 型 >< 对 象 名 >] 
TO< 用 户 >[ ,< 用 户 >] … 
[WITH GRANT OPTION] ; 
其 功能 为 将 指定 操作 对 象 的 指定 操作 权限 授予 指定 的 用 户 。 
不 同类 型 的 操作 对 象 有 不 同 的 操作 权限 ,如 表 3-7 所 示 。 
接受 权限 的 用 户 可 以 是 一 个 或 多 个 具体 用 户 ,也 可 以 是 PUBLIC( 表 示 全 体 用 户 ) 。 
如 果 指 定 了 WITH GRANT OPTION 子 句 , 则 获得 某 种 权限 的 用 户 还 可 以 把 这 种 权 


限 再 授予 别 的 用 户 ; 如 果 没 有 指定 WITH GRANT OPTION 子 句 , 则 获得 某 种 权限 的 用 户 
只 能 使 用 该 权限 ,但 不 能 传播 该 权限 。 


【 例 3.64】 把 对 C 表 和 S 表 的 全 部 权限 授予 用 户 Ul 和 U2。 


GRANT ALL PRIVIEGES ON TABLE C，S TO Ul,U2; 


表 3-7 不 同类 型 操作 对 象 的 操作 权限 


操作 对 象 对 象 类 型 操作 权限 
属性 列 TABLE SELECT INSERT .UPDATE.DELETE ALL PRIVIEGES 
视图 TABLE SELECT INSERT.UPDATE.DELETE、ALL PRIVIEGES 
基本 表 TABLE SELECT、INSERT、UPDATE、DELETE ALTER、INDEX、 
ALL PRIVIEGES 
数据 库 DATABASE CREATETAB 


【 例 3.65】 把 查询 C 表 和 修改 Cname 的 权限 授予 用 户 U3, 并 允许 他 将 此 权限 授予 其 


他 用 户 。 


GRANT SELECT, UPDATE(Cname) ON TABLE C TO U3 
WITH GRANT OPTION; 


【 例 3.66】 把 在 数据 库 S 中 建立 表 的 权限 授予 用 户 U3。 
GRANT CREATETAB ON DATABASE S TO U3; 


注意 : 因为 对 象 类 型 的 关键 字 不 同 ,所 以 数据 库 和 表 的 权限 授予 要 分 开 进 行 。 
3.6.2 收回 权限 
授予 的 权限 可 以 由 DBA 或 其 他 授权 者 用 REVOKE 语句 收回 ,其 一 般 格式 为 : 
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REVOKE < 权限 >[,< 权 限 >] … 
[ON < 对 象 类 型 >< 对 象 名 >] 
FROM < 用 户 >[ ,< 用 户 >] …; 


【 例 3.67】 把 用 户 Ul 对 C 表 和 S 表 的 全 部 权限 收回 。 
REVOKE ALL PRIVIEGES ON TABLE C, S FROM Ul; 

【 例 3.68】 把 用 户 U3 的 修改 Cname 的 权限 收回 。 
REVOKE UPDATE( Cname) ON TABLE C FROM U3; 


如 果 在 收回 U3 的 权限 之 前 ,U3 已 经 将 此 权限 授予 了 U4 和 U5, 则 收回 U3 权限 的 同 
时 ,U4 和 U5 的 权限 也 自动 级 联 收回 了 。 如 果 U4 还 从 其 他 用 户 和 DBA 处 获得 了 此 权限 ， 
则 此 权限 不 能 被 收回 。 系 统 只 收回 直接 或 间接 从 U3 处 获得 的 权限 。 

DBA 拥有 对 数据 库 中 所 有 对 象 的 所 有 权限 ,并 可 以 根据 应 用 的 需要 将 不 同 的 权限 授予 
不 同 的 用 户 。 而 所 有 授予 出 去 的 权限 在 必要 时 又 都 可 以 用 REVOKE 语句 收回 。 


C7 本 章 小 结 


本 章 讨 论 关 系数 据 库 标 准 语言 SQL。SQL 是 关系 数据 库 的 标准 语言 ,已 广泛 应 用 在 商 
用 系统 中 。 首 先 分 析 了 SQL 语言 的 特点 ,然后 通过 一 些 实例 分 别 对 SQL 语言 的 数据 定义 、 
数据 查询 和 数据 操纵 功能 做 了 详细 讲解 ,涵盖 了 表 的 创建 、 表 的 简单 查询 与 复杂 查询 ,数据 
更 新 等 常用 操作 。 其 中 最 为 复杂 的 是 SELECT 查询 语句 ,包括 单 表 查询 ,连接 查询 、 嵌 套 查 
询 和 集合 查询 几 大 类 。 并 在 此 基础 上 介绍 了 视图 的 概念 以 及 视图 的 定义 、 删 除 、 查 询 和 更 新 
操作 。 最 后 介绍 了 用 于 数据 控制 的 授权 和 收回 权限 的 语句 用 法 。 


6.8 习题 


3.8.1 名 词 解释 
基本 表 、 视 图 
3.8.2 简 答题 


1. 简 述 基本 表 和 视图 的 区 别 和 联系 , 试 述 SQL 语言 的 特点 。 
2. 简 述 视图 的 优点 。 
3. 哪些 视图 是 可 以 更 新 的 ? 哪些 视图 是 不 可 更 新 的 ? 各 举 一 例 说 明 。 


3.8.3 综合 题 


设 有 一 个 SPJ 数据 库 ,包括 S、.P、J、SPJ 四 个 关系 模式 : 
S(SNO,SNAME,STATUS,CITY); 
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P(PNO.,PNAME.COLOR.WEIGHT); 

JJUNO,JNAME,CITY); 

SPJ(SNO,PNO,JNO.QTY); 

供应 商 表 S 由 供应 商 代码 (SNO) ,供应 商 姓名 (SNAME) .供应 商 状态 (STATUS) \ 供 
应 商 所 在 城市 (CITY) 组 成 ; 

零件 表 P 由 零件 代码 (PNO)、 零 件 名 (PNAME)、 颜 色 (COLOR)., 重 量 (WEIGHT) 
组 成 ; 

工程 项 目 表 三 由 工程 项 目 代 码 (JNO)、 工 程 项 目 名 (JNAME) .工程 项 目 所 在 城市 
(CITY) 组 成 ; 

供应 情况 表 SPJ 由 供应 商 代码 (SNO)、 零 件 代 码 (PNO) 工程 项 目 代码 (JNO) ,供应 数 
量 (QTY) 组 成 ,表示 某 供应 商 供应 某 种 零件 给 某 工 程 项 目的 数量 为 QTY。 

(1) 用 SQL 语句 建立 以 上 四 个 表 。 

(2) 找 出 所 有 供应 商 的 姓名 和 所 在 城市 。 

(3) 找 出 所 有 零件 的 名 称 .颜色 .重量 。 

(4) 找 出 使 用 供应 商 S1 所 供应 零件 的 工程 号 码 。 

(5) 找 出 工程 项 目 J2 使 用 的 各 种 零件 的 名 称 及 其 数量 。 

(6) 找 出 上 海 厂商 供应 的 所 有 零件 号 码 。 

(7) 找 出 使 用 上 海产 的 零件 的 工程 名 称 。 

(8) 找 出 没有 使 用 天 津 产 的 零件 的 工程 号 码 。 

(9) 把 全 部 红色 零件 的 颜色 改 成 蓝 色 。 

(10) 由 S5 供给 J4 零件 P6 改 为 由 S3 供应 ,请 做 必要 的 修改 。 

(11) 从 供应 商 关 系 中 删除 S2 的 记录 ,并 从 供应 情况 关系 中 删除 相应 的 记录 。 

(12) 请 将 (S2,J6,P4,200) 插 入 供应 情况 关系 。 


关系 数据 理论 | 


这 一 章 讨论 关系 数据 理论 。 从 数据 存储 异常 问题 引出 关系 数据 库 的 规范 化 设计 理论 。 
规范 化 设计 理论 对 关系 数据 库 结 构 的 设计 起 着 重要 作用 。 本 章 介绍 最 重要 的 一 种 数据 依 
赖 一 一 函数 依赖 ,关系 模式 进一步 规范 化 的 内 容 , 以 及 关系 模式 的 分 解 。 
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数据 库 系 统 设计 的 关键 是 数据 模式 的 设计 , 即 如 何 把 现实 世界 表达 成 一 个 合适 的 数据 
模式 。 由 于 关系 模式 有 严格 的 数学 理论 基础 ,并 且 关 系 模式 不 但 可 以 用 二 维 表 描述 实体 ,还 
可 以 用 二 维 表 描 述 实体 之 间 的 联系 ,因此 ,人 们 通常 以 关系 模式 为 背景 来 讨论 这 个 问题 ,就 
形成 了 数据 库 逻 辑 设计 的 一 个 有 力 工具 : 关系 数据 库 的 规范 化 理论 。 


4.1.1 关系 模式 设计 概述 


数据 库 设计 的 一 个 最 基本 的 问题 是 如 何 建立 一 个 好 的 数据 库 模 式 , 即 给 出 一 组 数据 ,如 
何 构 造 一 个 适合 于 它们 的 数据 模式 ,使 数据 库 系统 无 论 是 在 数据 存储 方面 ,还 是 在 数据 操纵 
方面 都 有 较 好 的 性 能 。 在 第 1 章 讨论 数据 模型 时 ,指出 了 E-R 模型 常 被 作为 描述 现实 世界 
的 数据 模型 。 除 了 面向 对 象 的 数据 库 设计 ,E-R 方法 的 确 是 当前 设计 数据 库 的 基本 方法 。 
人 们 总 是 先 从 现实 世界 得 到 E-R 模型 ,然后 ,再 将 E-R 模型 转换 成 各 类 数据 库 系 统 支 持 的 
数据 库 模式 。 最 后 一 步 工 作 可 以 用 第 7 章 介绍 的 "机械 ”的 方法 完成 。 无 论 通 过 ER 模型 
的 方法 ,还 是 别 的 方法 得 到 的 数据 库 设 计 , 都 可 能 有 数据 元 余 ,而 元 余 可 能 会 引起 其 他 不 希 
望 出 现 的 异常 ,不 能 保证 设计 的 数据 库 具 有 好 的 性 能 。 

在 E-R 模型 提出 以 前 ,Codd 提出 了 关系 数据 库 理论 ,并 发 展 了 一 套 关 系数 据 库 设 计 的 
理论 , 即 关 系 的 规范 化 理论 。 这 套 理论 根据 现实 世界 存在 的 数据 依赖 进行 关系 模式 的 规范 
化 处 理 , 从 而 得 到 一 个 好 的 数据 库 设计 。 数 据 依赖 实际 上 是 一 种 关系 上 的 语义 完整 性 约束 ， 
是 对 关系 模式 任何 时 刻 的 实例 取 值 的 限制 。 如 果 定 义 了 关系 的 关键 字 , 也 就 定义 了 “该 关系 
的 所 有 属性 依赖 于 主 关键 字 属 性 ( 主 属性 ) ”的 依赖 。 如 果 定 义 了 外 部 关键 字 , 当 将 这 个 关系 
和 外 部 关键 字 指引 的 关系 合并 (自然 连接 ) 时 ,新 生成 的 关系 中 从 被 指引 的 关系 得 到 的 所 有 
属性 依赖 于 外 部 关键 字 ( 它 在 新 关系 中 不 一 定 是 关键 字 )。 规 范 化 后 的 关系 模式 至 少 可 以 避 
人 免 许 多 不 希望 出 现 的 异常 。 当 然 , 找 出 所 有 的 数据 依赖 并 不 是 一 件 容易 的 事 , 而 且 纯 粹 根据 
存在 的 数据 依赖 进行 关系 规范 化 ,所 得 到 的 数据 库 设计 (在 实际 中 ) 也 不 一 定 是 最 优 的 ,因为 
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此 时 没有 考虑 关系 的 实际 大 小 和 对 关系 经 常 进 行 什么 样 的 操作 。 

但 是 ,关系 数据 库 设计 的 理论 仍 有 实用 价值 。 首 先 , 关 系数 据 库 设 计 的 理论 能 帮助 用 户 
分 析 和 判别 什么 是 一 个 好 的 数据 库 模式 ,甚至 判别 怎样 的 E-R 模型 可 转化 出 好 的 数据 库 模 
式 ; 其 次 ,从 E-R 模型 转化 得 到 关系 模式 后 可 再 用 关系 规范 化 优化 ; 第 三 ,正如 第 7 章 指出 
的 ,用 机 械 的 方法 从 E-R 模型 转化 得 到 的 关系 模式 有 时 很 烦琐 ,关系 数据 库 设计 的 理论 可 
以 指导 我 们 合并 关系 模式 ,以 精简 设计 。 所 以 ,流行 的 关系 数据 库 设计 方法 是 先 得 到 E-R 
模型 ,然后 转化 为 关系 模式 ,再 进行 关系 模式 的 优化 。 


4.1.2 关系 模式 的 数学 表示 


关系 模式 是 对 关系 的 描述 ,可 以 将 关系 模式 形式 定义 成 一 个 五 元 组 : 
R(U,D,DOM,F) 


其 中 : 

(1) RR 为 关系 名 

(2) U 为 一 组 属性 , 即 组 成 R 的 全 部 属性 的 集合 ; 

(3) DD 为 域 的 集合 , 即 属性 取 值 范围 的 集合 ; 

(4) DOM 为 U 与 D 之 间 的 映像 ; 

(5) 下 为 属性 组 U 上 的 数据 依赖 关系 的 集合 。 

关系 是 关系 模式 在 某 一 时 刻 的 状态 或 内 容 。 关 系 模式 是 静态 的 、 稳 定 的 ,关系 是 动态 
的 ,不 同时 刻 关系 模式 中 的 关系 可 能 会 不 同 。 但 是 ,每 一 个 关系 都 要 满足 关系 模式 的 数据 依 
赖 关系 集合 下 的 约束 条 件 。 

由 于 在 关系 模式 RCU,D,DOM,F) 中 ,影响 数据 库 设 计 的 主要 因素 是 U 和 下 ,D 和 
DOM 对 设计 的 影响 不 大 ,可 以 忽略 。 这 样 ,关系 模式 可 以 定义 为 三 元 组 RU,F) 当 且 仅 当 
U 上 的 一 个 关系 r 满足 下 时 ,~ 称 为 关系 模式 尽 (U,EF) 的 一 个 关系 。 


4.1.3 实例 分 析 


在 数据 库 中 怎样 才能 建立 一 个 好 的 关系 数据 库 模式 呢 ? 在 解决 如 何 设计 一 个 好 的 关系 
数据 库 模 式 之 前 ,首先 看 一 看 什么 是 坏 的 数据 库 设 计 。 

【 例 4.1】 教师 授课 管理 系统 。 在 实际 当中 进行 教师 授课 的 人 工 管理 ,通常 是 制作 一 
张 表 ( 如 表 4-1 所 示 )。 


表 4-1 教师 授课 管理 系统 使 用 的 二 维 表 


教师 号 教师 姓名 联系 电话 课程 号 课程 名 
t01 李 桦 5523227 i | 可 
j02 | 微机 原理 
jol | 计算 机 文化 基础 
t02 王 伟 5580923 j03 | C 语 言 程序 设计 
j04 | 计算 机 软件 基础 
t03 李 琳 4756859 j03 C 语言 程序 设计 
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管理 人 员 通 过 查询 表 4-1 来 了 解 某 个 教师 可 以 教授 哪些 课程 ,以 便 安 排 教学 任务 .通知 
授课 教师 。 对 这 个 实际 问题 ,把 它 设计 成 一 个 教师 授课 管理 的 计算 机 系统 ,首先 要 将 表 4-1 
中 的 数据 描述 成 关系 型 数据 库 的 关系 数据 模型 ,然后 将 表格 数据 存储 到 计算 机 中 。 关 系 模 
型 是 一 个 标准 的 二 维 表 , 要 准确 存储 表 4-1 中 的 数据 ,可 以 将 表 4-1 转换 为 表 4-2 所 示 的 
表格 。 


表 4-2 教师 授课 管理 系统 改进 后 的 二 维 表 


教师 号 教师 姓名 联系 电话 课程 号 课程 名 
t01 张 明 552322 jo1 计算 机 文化 基础 
t01 张 明 552322 j02 微机 原理 
t02 李 华 558092 jo1 计算 机 文化 基础 
t02 李 华 558092 j03 C 语言 程序 设计 
t02 李 华 558092 jo4 计算 机 软件 基础 
t03 王 伟 475685 jo3 C 语言 程序 设计 


可 以 看 到 , 表 4-2 完全 描述 了 表 4-1 所 描述 的 信息 ,并 且 表 4-2 是 一 个 关系 , 即 二 维 表 ， 
对 应 的 关系 模式 为 : R( 教 师 号 ,教师 姓名 ,联系 电话 ,课程 号 ,课程 名 )。 

由 现实 世界 中 的 事实 可 知 : 一 个 教师 只 有 一 个 教师 姓名 、 电 话 ; 一 门 课程 只 有 一 个 课 
于 是 关系 模式 R 的 关键 字 是 (教师 号 ,课程 号 ), 即 根据 每 个 教师 号 和 所 教 课 程 的 编号 
就 能 确定 课程 名 称 ,根据 每 个 教师 号 就 能 确定 教师 姓名 、 联 系 电话 。 虽 然 这 个 模式 只 有 五 个 
属性 ,但 在 使 用 过 程 中 明显 存在 下 列 问题 。 


1. 数据 元 余 


在 上 述 关系 模式 中 ,如 果 一 名 教师 可 以 教授 多 门 课 程 ,那么 这 名 教师 的 教师 号 .教师 姓 
名 ,联系 电话 就 要 重复 多 次 ,如 教师 张 明 、 李 华 。 

2. 更 新 异常 

由 于 数据 的 宛 余 , 在 数据 更 新 时 会 出 现 问题 。 例 如 ,一 个 教师 教 三 门 课程 ,在 关系 中 就 
会 有 三 条 记录 。 如 果 这 个 教师 的 地 址 改变 了 ,这 三 条 记录 中 的 联系 电话 都 要 改变 ; 若 在 修 
改 的 过 程 中 ,有 一 条 记录 的 联系 忘记 更 改 了 ,就 会 造成 这 个 教师 联系 电话 不 一 致 的 错误 。 

3. 插入 异常 

在 关系 型 数据 库 中 ,关键 字 是 能 够 唯一 标识 记录 的 属性 或 属性 组 ,并 且 在 关系 中 ,作为 
关键 字 的 属性 不 能 为 空 值 。 也 就 是 说 ,系统 规定 : 在 关系 中 , 当 作为 关键 字 的 属性 没有 值 
时 ,这 样 的 记录 是 非法 记录 。 而 实际 情况 是 ,如 果 新 增加 一 名 教师 ,尚未 分 配 教学 任务 (没有 
课程 号 ) ,那么 教师 的 教师 号 .教师 姓名 和 联系 电话 就 无 法 形成 记录 ,存储 到 关系 中 去 ,因为 
课程 号 是 标识 课程 的 关键 字 , 不 能 为 空 。 同 样 ,对 于 一 门 新 课程 ,如 果 没 有 安排 任课 教师 , 则 
课程 信息 也 无 法 存储 到 关系 中 去 。 

4. 删除 异常 

与 插入 问题 相反 ,删除 操作 会 造成 一 些 信息 的 丢失 。 例 如 ,一 个 教师 原来 有 教学 任务 ， 
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目前 没有 安排 教学 任务 ,如 果 把 这 个 教师 的 所 有 记录 都 删除 ,就 把 这 个 教师 的 姓名 和 联系 电 
话 的 信息 也 从 数据 库 中 删 去 了 ,以 后 要 给 这 个 教师 安排 教学 任务 , 则 无 处 查询 其 相关 信息 ， 
这 也 是 一 种 不 合理 的 现象 。 更 为 严重 的 是 ,如 果 删 除了 一 些 教 师 信 息 , 可 能 会 无 意 间 将 这 些 
教师 所 授课 程 信息 也 一 并 删除 了 ; 或 者 因为 删除 某 些 课程 信息 ,而 错误 地 删除 了 一 些 教师 
信息 。 

如 果 将 上 述 模式 分 解 成 下 面 三 个 关系 模式 : R1( 教 师 号 ,教师 姓名 ,联系 电话 ); R2 ( 课 
程 号 ,课程 名 ); R3 (教师 号 ,课程 号 ) 。 

对 应 的 关系 实例 如 表 4-3、 表 4-4 和 表 4-5 所 示 。 


表 4-3 RI1 
教师 号 教师 姓名 联系 电话 
t01 张 明 552322 
t02 李 华 558092 
t03 王 伟 475685 


课程 号 课程 名 课程 名 
j01 计算 机 文化 基础 C 语言 程序 设计 
j02 微机 原理 计算 机 软件 基础 
表 4-5 R3 
教师 号 课程 号 教师 号 课程 号 
t01 jol 102 j03 
t01 j02 102 j04 
t02 j01 103 j03 


可 以 看 到 表 4-3、 表 4-4 和 表 4-5 完全 描述 了 表 4-2 的 所 有 信息 ,并 且 对 表 4-2 进行 了 分 
解 : 表 4-3 描述 教师 的 基本 信息 ; 表 4-4 描述 课程 的 基本 信息 ; 表 4-5 描述 教师 讲授 课程 的 
信息 。 这 样 就 解决 了 前 面 提 到 的 数据 元 余 、 更 新 异常 .插入 异常 和 删除 异常 的 问题 , 即 每 个 
教师 的 信息 (教师 号 ,教师 姓名 、 联 系 电话 ) 只 存放 一 次 ,不 管 这 个 教师 有 没有 教学 任务 ,他 
的 信息 均 在 关系 R1 中 存放 ,数据 的 更 新 .插入 和 删除 均 不 会 产生 上 述 操作 异常 。 

分 析 关 系 模式 尽 ,其 主 关键 字 为 属性 组 (教师 号 ,课程 号 ) , 非 主 属性 中 教师 名 、 联 系 电话 
由 教师 号 唯一 确定 ; 非 主 属性 中 课程 名 由 课程 号 唯一 确定 。 分 析 R1、R2、R3,R1 的 主 关键 
字 是 教师 号 , 非 主 属性 教师 名 、 联 系 电话 严格 依赖 于 教师 号 ; R2 的 主 关键 字 是 课程 号 , 非 主 
属性 课程 名 由 课程 号 唯一 确定 ; R3 的 主 关键 字 为 属性 组 (教师 号 ,课程 号 ) ,无 非 主 属性 。 
可 以 这 么 说 ,关系 模式 是 否 合适 与 关系 中 非 主 属性 对 主 属性 的 数据 依赖 有 关 。 

当然 ,对 分 解 了 的 关系 进行 一 些 复杂 的 查询 操作 时 ,就 必须 进行 关系 的 连接 运算 ,这 增 
大 了 查询 运算 的 代价 ; 而 在 原来 的 单个 关系 中 , 则 只 需要 进行 单个 关系 上 的 选择 和 投影 运 
算 。 那 么 ,如 何 确定 关系 的 分 解 是 否 有 益 ? 分 解 后 是 否 仍然 存在 数据 元 余 和 更 新 异常 等 问 
题 ? 怎样 的 关系 模式 才 好 ? 这 将 是 本 章 所 要 讨论 的 问题 。 

在 这 里 ,需要 强调 一 下 数据 依赖 和 宛 余 之 间 的 关系 。 一 般 说 来 ,依赖 是 对 关系 模式 任何 
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时 刻 的 实例 的 值 的 约束 ,只 有 取 满 足 约束 条 件 的 值 构 成 的 关系 才 是 合法 的 关系 , 它 表示 了 现 
实 世 界 的 某 一 可 能 状态 。 同 时 ,根据 数据 间 的 依赖 关系 ,可 以 由 一 些 数据 推导 出 另 一 些 数 
据 。 比 如 ,知道 了 “t01” 教 师 的 姓名 和 联系 电话 ,又 知道 了 “j01” 课 程 和 “j02” 课 程 由 同一 个 教 
师 讲授 ,就 可 以 推导 出 *j02? 课 程 对 应 的 教师 姓名 和 联系 电话 。 因 此 ,我们 可 以 利用 依赖 关 
系 避 免 存储 元 余 的 数据 ,同时 也 避免 了 宛 余 带 来 的 其 他 异常 。 然 而 ,并 不 是 一 切 元 余 都 不 
好 ,在 合法 的 关系 中 有 某 些 元 余 也 是 合乎 情理 的 ,但 必须 采取 措施 避免 元 余 带 来 的 数据 不 
一 致 。 

如 果 依 赖 是 函数 依赖 的 形式 , 则 元 余 的 形式 是 明显 的 。 例 如 ,在 关系 R( 供 应 商 ,地 址 ， 
产品 ,价格 ) 中 看 到 有 两 个 元 组 t1(* 王 刚 ” “解放 路 18 号 ”, “彩电 ”,3000) 和 12(* 王 刚 ”， 
“7???”,“DVD”,1000), 则 可 以 假设 供应 商 能 决定 地 址 , 即 地 址 依赖 于 供应 商 , 从 而 推导 出 
“7??3?” 代 表 “ 解 放 路 18 号 ”。 因 此 ,函数 依赖 使 得 对 一 给 定 的 供应 商 , 除 第 一 个 元 组 地 址 字段 
值 外 ,其 余地 址 字段 的 值 都 是 元 余 的 ,不 用 查看 就 能 知道 。 反 过 来 ,如 果 地 址 和 供应 商 之 间 
不 存在 函数 依赖 , 即 一 个 供应 商 有 多 个 地 址 , 则 不 能 推导 出 *???” 的 值 , 这 个 字段 也 就 不 是 元 
余 的 了 。 

当 存 在 比 函 数 依赖 更 一 般 的 依赖 时 ,元 余 存 在 形式 就 不 明显 了 。 但 是 在 所 有 的 情况 下 ， 
消除 宛 余 的 办 法 和 元 余 的 导致 因素 有 关 。 例 如 ,要 消除 函数 依赖 引起 的 元 余 , 可 以 根据 函数 
依赖 关系 来 实现 。 


@.2 函数 依赖 


数据 依赖 是 指 通过 一 个 关系 中 属性 之 间 值 的 相等 与 否 体现 出 来 的 数据 间 的 相互 关系 ， 
是 现实 世界 事物 之 间 相 互 关 联 性 的 一 种 表达 ,是 属性 固有 语义 的 体现 。 大 多 数 数据 依赖 都 
是 函数 依赖 。 


4.2.1 函数 依赖 的 一 般 概 念 


关系 模式 的 定义 实际 上 只 需要 指出 关系 的 目 数 ,但 在 很 多 情况 下 ,即使 某 些 元 组 有 正确 
的 目 数 ,而 且 各 分 量 取 自 正 确 的 域 中 ,也 不 一 定 就 是 某 个 关系 的 元 组 。 一 般 , 在 关系 上 还 应 
有 两 类 限制 : 
。 元 组 分 量 的 语义 限制 。 例 如 ,没有 5 米 高 的 人 ,也 没有 年 龄 27 岁 而 工龄 35 年 的 职 
员 。 这 些 限制 可 以 采用 DBMS 来 进行 检查 ,这 些 不 合 情 理 的 值 可 能 是 由 于 错误 的 
输入 或 计算 造成 的 。 因 此 ,在 设计 数据 库 模式 时 ,必须 进行 数据 完整 性 的 约束 。 
。 关系 中 属性 间 值 相等 或 不 等 的 限制 。 有 一 些 约束 不 取决 于 元 组 中 分 量 的 取 值 范围 ， 
而 是 要 求 两 个 元 组 在 确定 的 分 量 上 保持 一 致 ,这 类 约束 中 最 重要 的 是 函数 依赖 。 
为 了 方便 起 见 ,假设 RC(A1, As, A;,…,A,) 是 一 个 关系 模式 ,U=={Al, As, As,…,A,} 
是 尺 的 所 有 属性 的 集合 ,XX、Y 和 2 表示 R 中 的 属性 子 集 。 


1. 函数 依赖 
定义 4.1 设 R(D) 是 属性 集 U 上 的 关系 模式 ,X 和 Y 是 U 的 子 集 。 若 对 于 R(U) 的 任 
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意 一 个 可 能 的 关系 +,r 中 不 可 能 存在 两 个 元 组 在 X 上 的 属性 值 相等 ,而 在 YY 上 的 属性 值 不 
等 , 则 称 X 函数 决定 Y 或 Y 函数 依赖 于 X, 记 作 X-~Y,X 称 为 决定 因素 。 

一 个 函数 依赖 成 立 就 意味 着 关系 在 任何 一 刻 的 实例 都 满足 函数 依赖 条 件 。 要 确定 一 个 
函数 依赖 关系 ,需要 和 弄 清 楚 数 据 的 语义 ,而 数据 的 语义 是 现实 世界 的 反映 ,不 是 主观 的 腾 断 
或 由 关系 的 当前 实例 所 决定 的 。 例 如 在 百货 商店 的 顾客 关系 中 , 若 每 个 顾客 都 只 有 一 个 地 
址 , 且 没有 重 名 的 顾客 , 则 顾客 地 址 对 顾客 姓名 的 函数 依赖 可 表示 成 : Cname>Adrr。 
因此 需要 注意 : 

(1) 函数 依赖 X->Y 的 定义 ,强调 模式 R 的 任意 具体 关系 x 应 具有 的 特性 ,而 不 是 某 个 
或 某 几 个 具体 关系 具有 的 特性 。 

(2) 函数 依赖 X->Y 的 定义 ,强调 具体 关系 的 任意 两 条 记录 具有 的 特性 ,而 不 是 某 两 条 
记录 具有 的 特性 。 

(3) 函数 依赖 关系 是 自然 产生 的 ,如 教师 姓名 函数 依赖 于 教师 号 ,教师 的 联系 电话 函数 
依赖 于 教师 号 。 

下 面 介绍 一 些 术 语 与 记号 : 

。 XY, 但 Y 不 是 X 的 子 集 , 则 称 XY 是 非 平 凡 函 数 依赖 。 

XY, 但 Y 是 XX 的 子 集 , 则 称 久 >Y 是 平凡 函数 依赖 。 
若 X 一 Y, 则 X 称 为 这 个 函数 依赖 的 决定 因素 ,或 决定 属性 集 。 

。 若 X-=Y,Y-X, 则 记 作 X<>Y。 

。 若 Y 不 函数 依赖 于 X , 则 记 作 X ~> Y。 

定义 4.2 在 关系 模式 RCU) 中 ,对 于 UU 的 子 集 XX 和 Y, 如 果 X 匀 >Y, 但 YX, 则 称 X 一 
Y 是 非 平凡 函数 依赖 ; 如 果 YCX, 则 称 久 >Y 是 平凡 函数 依赖 。 

显然 ,对 于 任 一 关系 模式 ,平凡 函数 依赖 都 是 成 立 的 ,因此 ,如 果 不 特别 声明 ,我们 讨论 
的 都 是 非 平凡 函数 依赖 。 

定义 4.3 在 关系 模式 R(U) 中 ,如 果 X->Y, 并 且 对 于 X 的 任何 一 个 真子 集 X', 都 有 XX 
ce 了 , 则 称 了 对 X 完全 函数 依赖 , 记 作 六 一 >Y。 


对 于 如 下 关系 : 教室 (课程 , 班级, 时间, 教室 ), 其 中 存在 (课程, 班级, 时间) 一 > { 教 
室 ) ,因为 一 间 教 室 在 不 同 的 时 间 可 供 多 个 班级 上 多 门 课程 ,只 有 课程 ,班级 和 时 间 都 确定 以 
后 ,教室 才 唯 一 确定 。 
若 X_-=Y, 但 Y 不 完全 函数 依赖 于 X , 则 称 Y 对 XX 部 分 函数 依赖 , 记 作 XX 一 >Y。 
如 ,教师 姓名 王 教师 号 为 完全 函数 依赖 ,( 教 师 号 ,课程 号 ) 习 课程 名 为 部 分 函数 依赖 。 

定义 4.4 在 关系 模式 R(U) 中 ,如 果 X>Y, YZ,Y ~>X, 且 Y 不 是 X 的 子 集 ,Z 不 
是 Y 的 子 集 ( 均 为 非 平凡 函数 依赖 ), 则 称 Z 传递 函数 依赖 于 X , 记 作 一 >Z。 

加 上 条 件 Y~>X ,是 因为 如 果 Y->~X, 则 X<~Y, 实 际 上 是 XZ, 是 直接 函数 依赖 ,而 
不 是 传递 函数 依赖 。 

例如 ,关系 R(SNO.,CNO,SDEPT,SLOC.CNAME), 其 中 SNO 为 学 生 的 学 号 ,CNO 
为 课程 号 ,SDEPT 为 学 生 所 在 系 .SLOC 为 学 生 的 住处 (每 个 系 的 学 生 住 在 同一 个 地 方 )， 
CNAME 为 课程 名 称 。 在 关系 R 中 ,SNO 一 SDEPT, 而 SDEPT->SLOC,SNO->SLOC 为 传 
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递 函数 依赖 。 
例如 ,对 如 下 关系 : 教师 (姓名 ,职务 ,职务 工资 ) ,其 中 ,姓名 一 职务 ,职务 一 职务 工资 ， 


则 姓名 一 职务 工资 ,所 以 ,姓名 一 > 工资 。 

定义 4.5 设 下 是 R 的 函数 依赖 集合 ,XY 是 RR 中 的 一 个 函数 依赖 ,如 果 对 于 尺 中 任 
何 一 个 满足 下 的 取 值 ,都 必然 满足 X>Y, 则 称 下 逻辑 蕴涵 X>Y, 或 称 X>Y 可 以 由 下 扒 
导 。 被 下 所 逻辑 蕴涵 的 函数 依赖 的 全 体 称 为 下 的 闭 包 (Closure) , 记 为 F+ 。 一 般 情 况 下 
FEF+ , 当 F=F+ 时 , 称 下 是 一 个 函数 依赖 的 满族 。 

函数 依赖 是 通过 一 个 关系 中 属性 间 值 的 相等 与 否 体现 出 来 的 数据 间 的 相互 关系 , 它 决 
定 于 数据 的 语义 ,而 与 具体 的 关系 无 关 。 函 数 依赖 是 模式 级 的 概念 ,是 数据 模型 的 组 成 部 
分 。 定 义 关系 模式 上 属性 组 之 间 存 在 的 函数 依赖 关系 的 条 件 是 这 个 函数 依赖 必须 在 关系 模 
式 的 所 有 实例 上 成 立 ,而 不 是 在 个 别 实例 上 成 立 。 也 就 是 说 ,不 能 从 具体 的 关系 模式 的 实例 
判断 某 属性 组 函数 依赖 于 某 属性 组 ,只 能 判断 一 个 关系 模式 的 实例 满足 某 函 数 依赖 。 例 如 ， 
在 4.1 节 给 出 了 “学 生 " 关 系 模式 的 一 个 实例 ,考察 这 个 关系 中 已 有 的 元 组 ,可 以 断定 该 实例 
满足 函数 依赖 系 名 一 系 主任 ,但 不 能 由 此 得 出 “学 生 " 关 系 模式 中 存在 函数 依赖 : 系 名 一 
系 主任 ,因为 所 考察 的 只 是 一 组 有 限 的 局 部 数据 ,不 能 排除 可 能 有 一 些 特殊 的 系 有 两 个 并 列 
的 系 主任 。 函 数 依赖 只 能 根据 现实 世界 的 语义 确定 ,从 这 种 意义 上 讲 , 函 数 依赖 的 确定 实际 
上 是 对 现实 世界 的 论断 。 函 数 依赖 一 旦 确定 ,任何 时 候 (过 去 、 现 在 和 将 来 ) 关 系 的 所 有 实例 
都 应 满足 这 个 函数 依赖 。 由 于 关系 将 来 具体 的 取 值 不 能 一 一 列 出 并 进行 验证 ,所 以 函数 依 
赖 只 能 在 对 现实 世界 进行 调查 和 分 析 以 后 ,根据 数据 客观 存在 的 联系 和 企业 或 组 织 管理 的 
规章 制度 来 确定 。 


2. 关键 字 ( 码 ) 


在 第 2 章 中 已 经 提 到 ,对 于 现实 世界 的 每 一 实体 集合 ,都 有 一 关键 字 ( 本 章 称 其 为 码 )， 
即 唯一 确定 各 个 实体 的 一 组 属性 。 实 体 集合 关键 字 的 值 唯一 确定 一 个 实体 ,从 而 确定 该 实体 
各 属性 的 值 。 同 样 ,关系 上 最 重要 的 约束 是 关系 的 关键 字 约 束 ,就 是 说 关键 字 唯一 确定 关系 的 
元 组 ,从 而 确定 元 组 各 属性 的 值 。 在 函数 依赖 的 基础 上 ,可 以 更 确切 地 定义 关键 字 概 念 。 


定义 4.6 设 KK 为 关系 模式 RU, F> 中 的 属性 或 属性 组 合 ,车 KK 一 >U, 则 为 R 
的 关键 字 , 也 称 候选 码 。 若 关键 字 多 于 一 个 , 则 选 定 其 中 一 个 为 主 码 。 

包含 在 任何 一 个 候选 码 中 的 属性 ,叫做 主 属性 。 不 包含 在 任何 码 中 的 属性 称 为 非 主 属 
性 或 非 码 属性 。 最 简单 的 情况 ,单个 属性 是 码 。 最 极端 的 情况 ,整个 属性 组 是 码 , 称 为 全 码 。 
值得 注意 的 是 ,K 一 定 是 能 唯一 确定 R 中 某 一 元 组 的 最 小 属性 集合 。 

【 例 4.2】 关系 模式 R( 城 市 Z, 街 道 S, 邮 编 Z), 这 一 关系 表明 只 有 当 城 市 c 有 一 栋 大 
楼 的 街道 地 址 是 ;, 且 该 城市 该 地 址 的 邮编 是 = 时 ,R 的 关系 中 才 有 元 组 (c，s， <) ,假定 非 平 
凡 函 数 依赖 有 : (城市. 街道) 一 { 邮 编 }. {邮编} 一 (城市) , 即 地 址 决定 邮编 ,而 邮编 尽管 不 决 
定 街道 地 址 ,但 决定 城市 。 可 以 看 出 ,其 中 {城市 ,街道 ) 和 {街道 ,邮编 都 是 关键 字 。 

定义 4.7 关系 模式 尺 中 属性 或 属性 组 合 X 并 非 及 的 码 , 但 X 是 另 一 个 关系 模式 的 
码 , 则 称 X 是 R 的 外 部 码 , 也 称 外 码 。 

在 关系 模式 学 生 选 课 ( 学 号 , 课 号 ,成 绩 ) 中 ,学 号 不 是 关键 字 , 但 学 号 是 关系 模式 学 生 
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(学 号 ,姓名 ,年 龄 ) 的 关键 字 , 则 学 号 对 关系 模式 学 生 选 课 来 说 是 外 关键 字 。 主 关键 字 和 外 
关键 字 提 供 了 一 个 表示 关系 间 联 系 的 手段 。 


4.2.2 Armstrong 公理 系统 


为 了 从 已 知 的 函数 依赖 导出 更 多 新 的 函数 依赖 ,比如 从 已 知 的 函数 依赖 集 下 推导 出 下 
的 闭 包 FF* 的 全 部 函数 依赖 ,需要 一 套 形式 化 的 推理 规则 。1974 年 ,由 W. W. Armstrong 归 
纳 整 理 了 一 套 推 理 规则 , 即 Armstrong 公理 系统 。 它 是 关系 模式 分 解 算法 的 理论 基础 。 

设 关 系 模式 RC(U, F),U 为 R 的 属性 集合 ,为 U 上 的 一 组 函数 依赖 , 则 对 于 RCU, F) 
来 说 有 以 下 推理 规则 : 

(1) 自 反 律 (Reflexivity) : 如 果 YCXCU, 则 下 逻辑 蕴涵 XX 一 Y。 

(2) 增 广 律 (Augmentation) : 如 果 XY 为 所 蕴涵 , 且 , 则 XZ>YZ 为 下 所 蕴涵 。 

(3) 传递 律 (Transitivity) : 如 果 XY 和 YZ 为 下 所 蕴涵 , 则 XZ 为 所 蕴涵 。 

由 关系 的 性 质 ,可 以 证 明 Armstrong 公理 系统 是 有 效 的 和 完备 的 ,在 此 从 略 。 另 外 , 根 
据 上 述 的 Armstrong 公理 可 推导 出 下 面 三 条 推理 规则 : 

(4) 合并 规则 (The-Uniori Rule) : 如 果 X->Y 和 XX 习 Z 成 立 , 则 X 一 YZ 成 立 。 

(5) 伪 传 递 规 则 (The Pseudo Transitivity Rule) : 如 果 XY 和 WY 一 Z 成 立 , 则 XW 一 2Z 
成 立 。 

(6) 分 解 规则 (The Decomposition Rule) : 如 果 XY 和 ZCY 成 立 , 则 XZ 成 立 。 

由 Armstrong 公理 系统 ,可 以 得 到 以 下 重要 的 结论 : 

。X 一 Al，A,，A;，… ,A, 成 立 的 充分 必要 条 件 是 X 一 A; 成 立 , 其 中 i=1,2,…,k。 

。 函数 依赖 集 下 的 闭 包 FF 是 从 下 出 发 用 公理 导出 的 所 有 函数 依赖 的 集合 。 

【 例 4.3〗 对 4.2 节 的 “学 生 ” 关 系 模式 ,假设 通过 调查 某 学 校 的 管理 模式 和 工作 流程 ， 
略 去 一 些 次 要 的 、 不 用 数据 库 管 理 的 部 分 信息 ,可 以 确定 出 如 下 非 平凡 的 (完全 ) 函数 依赖 ， 
并 对 一 些 函 数 依赖 的 语义 进行 了 解释 : 

学 号 一 姓名 ,每 个 学 生 有 唯一 的 一 个 学 号 ; 

系 一 系 主任 ,每 个 系 最 多 只 有 一 个 系 主任 ; 

学 号 一 系 ,每 个 学 生 只 能 属于 一 个 系 ; 

(学 号 ,课程 ) 一 成 绩 ,一 个 学 生 选 修一 门 课程 有 一 个 最 终 的 成 绩 。 

从 以 上 函数 依赖 集合 出 发 ,利用 Armstrong 公理 系统 ,可 计算 出 该 函数 依赖 集合 的 闭 
包 , 下 面 列 出 其 中 的 一 部 分 : 

学 号 一 系 主 任 ; 

(学 号 , 系 ) 一 系 主任 ; 

(学 号 ,姓名 ) 一 系 主任 ; 

(学 号 ,课程 ) 一 系 主任 ; 

(学 号 ,课程 ) 一 系 ; 

(学 号 ,课程 ) 一 姓名 ; 


从 后 面 三 个 函数 依赖 可 看 出 ,( 学 号 ,课程 ) 是 关键 字 。 如 果 学 校 的 管理 规章 制度 不 同 ， 
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可 能 会 有 不 同 的 函数 依赖 存在 。 例 如 ,如 果 该 校 只 允许 学 生 选 修 本 系 提供 的 课程 , 则 存在 
( 系 , 课 程 ) 一 系 主任 等 函数 依赖 。 


人 3 关系 模式 的 规范 化 


在 关系 数据 模式 设计 中 ,为 了 避免 由 依赖 引起 的 数据 的 宛 余 和 更 新 异常 问题 ,必须 进行 
关系 数据 模式 的 合理 分 解 , 即 进行 关系 数据 模式 的 规范 化 。 自 1971 年 E. F. Codd 提出 关 
系 规范 化 理论 开始 ,人 们 对 数据 库 模 式 的 规范 化 问题 进行 了 长 期 的 研究 ,并 已 经 有 了 很 大 
进展 。 

关系 数据 库 中 的 关系 是 要 满足 一 定 规范 化 要 求 的 ,对 于 不 同 的 规范 化 程度 ,可 以 用 “ 范 
式 ” 来 衡量 , 记 为 zNF。 范 式 是 表示 关系 模式 的 级 别 ,是 衡量 关系 模式 规范 化 程度 的 标准 ， 
达到 范式 的 关系 才 是 规范 化 的 。 满 足 最 低 要 求 的 为 第 一 范式 ,简称 INF。 在 第 一 范式 的 基 
础 上 ,进一步 满足 一 些 要 求 的 为 第 二 范式 ,简称 2NF ,……: , 依 此 类 推 ,各 种 范式 之 间 的 联系 
是 5NFC4NFCBCNFC3NFC2NFCI1NF。 

范式 的 概念 最 早 是 由 E. F，Codd 提出 的 ,1971 一 1972 年 ,他 先后 提出 了 1NF、2NF、 
3NF 的 概念 ,1974 年 后 ,他 又 和 Boyce 共同 提出 了 BCNF 的 概念 ,1976 年 , Fagin 提出 了 
4NF 的 概念 ,后 来 又 有 人 提出 了 5NF 的 概念 。 在 这 些 范 式 中 ,最 重要 的 是 3NF 和 BCNF， 
这 是 进行 规范 化 的 主要 目标 。 

一 个 低 一 级 范式 的 关系 模式 ,通过 模式 分 解 可 以 转换 为 若干 个 高 一 级 范式 的 关系 模式 
的 集合 ,这 种 过 程 就 叫 规范 化 。 


4.3.1 第 一 范式 


定义 4.8 如 果 一 个 关系 模式 R 的 所 有 属性 都 是 不 可 分 的 基本 数据 项 , 则 RE 1NF。 

在 第 一 范式 中 只 要 求 关系 模式 的 关系 是 标准 的 二 维 表 , 没 有 论 及 关系 模式 中 所 存在 的 
函数 依赖 关系 ,这 种 范式 是 关系 模式 最 基本 的 要 求 。 

这 是 关系 模式 必须 达到 的 最 低 要 求 , 不 满足 该 条 件 的 关系 模式 称 为 非 规范 化 关系 , 即 非 
第 一 范式 。 目 前 大 部 分 商用 的 RDBMS( 关 系数 据 库 管理 系统 ) 处 理 的 关系 要 求 至 少 是 1NF 
的 ,但 一 些 新 型 的 RDBMS, 比 如 ORDBMS( 对 象 -关系 数据 库 管理 系统 ) 支 持 非 INF。 

关系 模式 R(SNO, CNO, SDEPT, SLOC, CNAME,GRADE), 其 函数 依赖 如 图 4-1 
所 示 。 

图 4-1 中 用 虚线 表示 部 分 函数 依赖 。 可 以 看 到 非 主 属性 SDEPT、SLOC 并 不 完全 函数 
依赖 于 码 (SNO,CNO)。 这 样 ,关系 RR 存在 以 下 几 个 问题 : 


SNO 


GRADE oO 


CNO 


图 4-1 关系 尺 的 函数 依赖 图 示 
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(1) 数据 元 余 。 如 果 某 系 有 1000 个 学 生 , 则 这 1000 学 生 记 录 的 SLOC 数据 项 将 重复 
000 次 。 除 此 之 外 ,只 要 某 门 课 被 不 同学 生 选 择 , 其 CNAME 数据 项 将 也 要 重复 。 可 见 , 此 
关系 数据 元 余 量 太 大 。 
(2) 插 和 人 异常。 假若 要 插入 一 个 学 生 , 但 该 生还 未 选课 , 即 这 个 学 生 无 CNO ,这样 的 元 
组 就 择 不 进 R 中 。 因 为 插入 元 组 时 必须 给 定 码 值 ,而 这 时 码 值 的 一 部 分 为 空 , 因 而 学 生 的 
固有 信息 无 法 插入 。 
(3) 删除 异常 。 假 定 某 个 学 生 开始 只 选 了 一 门 课 , 后 来 连 这 门 课 也 不 选 了 ,那么 此 记录 
的 CNO 数据 项 就 会 删除 ,可 是 CNO 为 主 属性 ,删除 了 该 数据 项 ,整个 元 组 就 必须 跟着 删 
除 ,使 得 此 学 生 的 其 他 信息 也 被 删除 了 ,从 而 造成 删除 异常 , 即 不 应 删除 的 信息 也 被 删除 了 。 
(4) 修改 复杂 。 某 个 学 生 从 数学 系 (MA) 转 到 计算 机 科学 系 (CS) ,这 本 来 只 需 修 改 此 
学 生 元 组 中 的 SDEPT 分 量 。 但 因为 关系 模式 R 中 还 含有 系 的 住处 SLOC 属性 ,学生 转 系 
将 同时 改变 住处 ,因而 还 必须 修改 元 组 中 的 SLOC 分 量 。 另 外 ,如 果 这 个 学 生 选 修了 开门 
课 ,SDEPT、SLOC 重复 存储 了 开 次 , 则 必须 无 遗漏 地 修改 KK 个 元 组 中 全 部 SDEPT、SLOC 
信息 ,造成 修改 的 复杂 化 。 


4:3.2 第 二 范式 


定义 4.9 若 关系 模式 REINF, 且 每 一 个 非 主 属性 都 完全 函数 依赖 于 码 , 则 RE2NF。 

从 上 面 的 例子 可 以 发 现 ,问题 在 于 非 主 属性 SDEPT、SLOC、CNAME 对 码 不 是 完全 函 
数 依赖 。 可 以 用 投影 分 解 把 关系 模式 R 分解 为 两 个 关系 模式 : SC(SNO,CNO, GRAGE)、 
CCCNO,CNAME) 和 SCSNO, SDEPT,SLOC) ,这 样 ,关系 模式 就 成 为 了 2NF。 

例如 ,有 以 下 关系 模式 ,表示 零件 的 库存 : 库存 (零件 号 ,仓库 号 ,零件 数量 )。 

假设 同一 种 零件 可 能 存放 在 多 个 仓库 中 ,同一 仓库 可 存放 不 同 种 类 的 零件 , 则 仅 有 一 个 
非 平凡 的 函数 依赖 存在 : (零件 号 ,仓库 号 ) 一 零件 数量 。 此 关系 是 1NF 的 , 且 非 主 属性 零 
件数 量 是 完全 函数 依赖 于 码 { 零 件 号 ,仓库 号 } 的 ,因为 若 只 确定 零件 号 或 仓库 号 ,零件 数量 
都 是 不 能 确定 的 ,所 以 库存 关系 是 2NF 的 。 

关系 模式 “学 生 ( 学 号 ,姓名 , 系 名 , 系 主任 ,课程 号 ,成 绩 )” 是 INF 的 ,其 码 为 {学 号 , 课 
程 号 ) ,而 非 主 属性 中 ,只 有 成 绩 是 完全 函数 依赖 于 码 , 姓 名 、 系 名 、 系 主任 对 码 都 是 部 分 函数 
依赖 ,因为 只 需要 学 号 就 可 以 确定 它们 的 值 .所 以 学 生 关系 模式 不 是 2NF 的 。 

可 以 用 简单 的 投影 分 解 来 使 非 2NF 的 关系 转变 为 2NF 的 关系 。 将 部 分 函数 依赖 关系 
中 的 主 属性 (决定 方 ) 和 非 主 属性 从 关系 模式 中 提出 ,单独 构成 一 个 关系 模式 ; 将 关系 模式 
中 余下 的 属性 ,加 上 码 ( 仍 要 保留 部 分 函数 依赖 的 决定 方 属 性 ,起 分 解 出 来 的 新 关系 之 间 的 
关联 作用 ) 构 成 另 一 关系 模式 。 例 如 ,学 生 ” 关 系 模式 就 可 分 解 成 两 个 2NF 的 关系 模式 : 
学 生 记录 (学 号 ,姓名 , 系 , 系 主任 ); 成 绩 ( 学 号 ,课程 ,成 绩 ) 。 

这 里 说 投影 分 解 ,意思 是 分 解 所 得 关系 的 实例 是 原 关 系 实例 的 投影 : 

r( 学 生 记 录 ) 一 xtc ,姓名 , 系 名 , 系 主任 )(7( 学 生 )) 
r( 成 绩 ) 一 rr 学 号 ,课程 成绩 ) (六 (学 生 )) 
分 解 后 ,4. 2 节 中 给 出 的 四 个 函数 依赖 仍然 成 立 : 
学 号 一 姓名 ,每 个 学 生 有 唯一 的 一 个 学 号 ; 


系 一 系 主任 ,每 个 系 最 多 只 有 一 个 系 主任 ; 
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学 号 一 系 ,每 个 学 生 只 能 属于 一 个 系 ; 
(学 号 ,课程 ) 一 成 绩 ,一 个 学 生 选 修一 门 课程 有 一 个 最 终 的 成 绩 。 


4.3.3 第 三 范式 


但 是 将 一 个 1NF 关系 分 解 为 多 个 2NF 的 关系 ,并 不 能 完全 消除 关系 模式 中 的 各 种 异 
常情 况 和 数据 宛 余 。 

例如 ,2NF 关系 模式 SCSNO，SDEPT,SLOC) 中 有 下 述 函 数 依赖 : SNO 一 SDEPT， 
SDEPT->~SLOC,SNO-~~SLOC, 也 就 是 说 S 中 存在 非 主 属性 对 码 的 传递 函数 依赖 。 关 系 S 
中 仍然 存在 插入 异常 .删除 异常 数据 元 余 和 修改 复杂 的 问题 。 

定义 4.10 关系 模式 RCU,F) 中 若 不 存在 候选 码头、 属性 组 Y 及 非 主 属性 ZCZCY)， 
使 得 X->Y(Y>X),Y-~Z 成 立 , 则 RCIU,F)E3NF。 

车 RE3NF, 则 每 一 个 非 主 属性 既 不 部 分 函数 依赖 于 码 也 不 传递 函数 依赖 于 码 。 

关系 模式 S 出 现 上 述 问题 的 原因 是 存在 非 主 属性 SLOC 对 码 SNO 的 传递 函数 依赖 。 
解决 办 法 是 对 S 投影 分 解 ,得 到 SD(SNO,SDEPT) 和 DL(SDEPT,SLOC)。 


4.3.4 BC 范式 


属于 3NF 的 关系 模式 可 以 在 一 定 程度 上 解决 原 2NF 关系 中 存在 的 插入 异常 ,删除 异 
常 .数据 元 余 度 大 ,修改 复杂 等 问题 ,但 并 不 能 使 其 完全 消除 。 

例如 ,关系 模式 ORDER(C,F,P) 中 ,C 表示 用 户 , 下 表示 厂家 ,了 表示 产品 。 假 设 某 用 
户 使 用 某 产品 从 一 个 厂家 进货 , 某 产品 可 由 多 个 厂家 生产 ,但 一 个 厂家 只 生产 一 种 产品 。 则 
关系 ORDER 中 (C,F) 和 (C,P) 均 为 候选 码 ,因为 没有 任何 非 主 属性 部 分 函数 依赖 和 传递 
依赖 于 码 , 因 此 ORDERE 3NF。 但 是 该 模式 仍 存在 以 下 问题 : 

(1) 数据 元 余 度 大 : 虽然 某 厂家 只 生产 一 种 产品 ,可 是 选 购 该 厂家 产品 的 用 户 都 要 记 
录 此 产品 信息 。 

(2) 修改 操作 复杂 : 当 某 个 厂家 的 产品 改变 名 称 后 ,所 有 选择 该 厂家 产品 的 用 户 都 要 
修改 此 信息 。 

(3) 增加 操作 异常 : 当 生 产 某 产品 的 厂家 增加 了 一 个 新 的 ,可 是 因为 还 没有 用 户 选 择 
他 , 则 此 厂家 生产 该 产品 的 信息 将 无 法 加 入 。 

(4) 删除 操作 异常 : 某 厂 家 的 所 有 用 户 均 不 选择 该 厂家 的 产品 时 ,就 需要 删除 这 些 记 
录 , 可 是 该 厂家 生产 的 产品 信息 也 就 不 存在 了 ,这 是 不 应 该 的 。 

之 所 以 这 样 ,是 因为 关系 ORDER(C,F,P) 中 的 存在 以 下 函数 依赖 : (C, P)- 一 下 ,CC,F) 一 
P,F>P。 也 就 是 说 , 主 属性 了 部 分 函数 依赖 于 码 (C,F) ,需要 进一步 规范 化 为 BCNF 。 

定义 4.11 关系 模式 RCIU,F)E1NF。 若 对 于 尺 的 每 一 个 函数 依赖 X-=Y, 且 YX， 
则 X 必 含有 码 , 那 么 RU,F)EBCNF , 即 尺 中 每 一 个 决定 因素 都 包含 码 , 则 尺 是 BCNF。 

上 述 关系 ORDER(C,F,P) 可 以 分 解 为 CFCC,F) 和 PFCE,P), 这 样 在 关系 模式 中 消 
除了 主 属性 对 码 的 部 分 函数 依赖 ,都 成 为 了 BCNF 。 

每 个 BCNF 的 关系 模式 都 具有 以 下 性 质 : 

。 所 有 非 主 属性 都 完全 函数 依赖 于 每 个 候选 码 。 
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。 所 有 的 主 属性 也 完全 函数 依赖 于 每 一 个 不 包含 它 的 候选 码 。 

。 没 有 任何 属性 完全 函数 依赖 于 非 码 的 任何 一 组 属性 。 

属于 3NF 的 关系 模式 有 的 属于 BCNF. 但 有 的 不 属于 BCNF。 假 设 R 只 有 一 个 候选 
码 ,那么 , 若 RE3NF, 则 尺 必 属于 BCNF。 

由 BCNF 的 定义 可 以 知道 ,一 个 满足 BCNF 的 关系 模式 一 定 是 非 主 属性 对 码 完全 函数 
依赖 ; 主 属性 对 不 包含 它 的 码 也 是 完全 函数 依赖 ; 没有 属性 完全 函数 依赖 于 码 以 外 的 属性 
组 。 下面 是 一 个 BCNF 的 关系 : 学 生 ( 学 号 ,姓名 ,专业 ,宿舍 ); 该 关系 中 ,假定 学 生 无 重 名 
的 , 则 码 为 {学 号 ) 或 {姓名 } , 非 主 属性 对 这 两 个 码 不 存在 部 分 函数 依赖 和 传递 函数 依赖 , 因 
此 是 3NF 的 ,而 同时 除 { 学 号 } 和 {姓名 } 以 外 没有 其 他 决定 因素 , 故 该 关系 也 是 BCNF 的 。 
再 看 一 个 不 是 BCNF 的 例子 : 

通讯 (城市 ,街道 ,邮政 编码 ) ; 

在 该 关系 中 , 码 为 {城市 ,街道 ), 非 主 属性 {邮政 编码 } 完 全 函数 依赖 于 码 , 且 无 传递 依 
赖 ,属于 3NF ,但 如 果 邮 政 编码 确定 了 ,城市 也 就 确定 了 , 它 是 一 个 决定 因素 ,而 这 个 决定 因 
素 不 是 码 ,也 不 包含 在 码 中 ,所 以 该 关系 不 是 BCNF 的 。 

值得 注意 的 是 3NF 与 BCNF 之 间 的 关系 ,一 个 关系 模式 属于 BCNF 则 一 定 属于 3NF， 
BCNF 是 3NF 的 特例 ,但 反之 则 不 然 , 属 于 3NF 的 关系 不 一 定 是 BCNF,3NF 是 BCNF 放 
宽 一 个 限制 , 即 允 许 决 定 因素 不 包含 码 。 

提出 BCNF 的 目的 是 消除 函数 依赖 所 产生 的 元 余 , 在 BCNF 关系 中 ,没有 一 个 属性 值 
可 只 用 函数 依赖 从 任何 其 他 属性 值 中 推测 出 来 。 


4.3.5 多 值 依赖 和 第 四 范式 
1. 多 值 依赖 


定义 4.12 设 R(D) 是 属性 集 U 上 的 一 个 关系 模式 。X、Y、Z 是 U 的 子 集 , 并 且 Z= 
U 一 X 一 Y, 多 值 依赖 X 一 >Y 成 立 , 当 且 仅 当 对 R 的 任 一 关系 r,r 在 (X,Z) 上 的 每 个 值 对 
应 一 组 Y 的 值 ,这 组 值 仅仅 决定 于 X 值 而 与 Z 值 无 关 。 

车 XY, 而 Z 二 @, 则 称 X 一 >Y 为 平凡 的 多 值 依赖 ,否则 称 X 一 >Y 为 非 平凡 的 多 
值 依赖 。 

多 值 依赖 性 质 : 

。 互补 性 : 若 X 一 >Y, 则 X 一 >U 一 X 一 Y; 

。 对称 性 : 若 X 一 >Y,.Z=U 一 X 一 Y, 则 X 一 一 2Z; 

。 传递 性 : 车 X 一 >Y.,Y 一 >Z, 则 X 一 一 Z 一 Y; 

。 增 广 性 : 车 X 一 >Y,VEW, 则 WX 一 VY; 
车 XY. 则 X 一 >Y; 
。 若 X>>Y,ZCY,YNW=6,W 一 >Z. 则 X 一 >2; 
。 若 X>>Y,X 一 >2Z, 则 XYZ; 
。 若 X>>Y,X>>Z. 则 X>>Y 几 2; 
。 若 X>>Y,XY>>Z, 则 X 一 2Z 一 Y。 


第 4 章 ”关系 数据 理论 


例如 ,关系 模式 STOREC(W.,S,C) 中 ,W 表示 仓库 ,S 表示 保管 员 ,C 表示 产品 。 假 设 某 
工厂 有 若干 个 仓库 ,生产 若干 种 产品 ,每 个 仓库 有 若干 保管 员 , 有 不 同 的 产品 ,每 个 保管 员 保 
管 所 在 的 仓库 的 所 有 产品 。 列 出 关系 如 表 4-6 所 示 。 


表 4-6 关系 模式 STORE 的 关系 集合 


W S Pp 
WI S1 Pl 
Wi1 S1 P2 
Wil Sl P3 
WI1 S2 Pl 
W1 S2 P2 
WI1 S2 P3 
WwW2 S3 P2 
W2 S3 P4 


关系 模式 STORE(W,S,P) 具 有 唯一 的 候选 码 (W,S,P), 即 全 码 , 所 以 STOREE 
BCNF ,但 仍 存在 以 下 问题 : 

(1) 数据 元 余 度 大 : 对 于 某 仓 库 来 说 ,无 论 谁 是 保管 员 ,保管 的 产品 是 一 样 的 ,因此 ,有 
多 少 保管 员 , 产 品 就 要 存储 多 少 次 。 

(2) 更 新 操作 复杂 : 当 仓 库 W2 增加 、 删 除 一 位 保管 员 时 ,就 需要 插入 或 删除 3 条 记录 ; 
当 某 仓库 保管 的 某 产品 发 生变 化 时 ,该 仓库 有 多 少 保管 员 就 需要 修改 多 少 条 记录 。 

之 所 以 出 现 这 样 的 问题 ,是 因为 保管 员 和 产品 的 取 值 是 毫 无 关系 的 ,实际 上 它们 都 只 由 
仓库 决定 , 即 它们 之 间 存 在 多 值 依赖 。 


2. 第 四 范式 


定义 4.13 关系 模式 R(U,F)E€ 1NF, 如 果 对 于 R 的 每 个 非 平 凡 多 值 依赖 X 一 一 
Y(Y 壬 XX) ,X 都 含有 码 , 则 称 R(U,F) €4NF。 

4NF 就 是 限制 关系 模式 的 属性 之 间 不 允许 有 非 平 凡 且 非 函 数 依赖 的 多 值 依赖 。4NF 
所 允许 的 非 平凡 的 多 值 依 赖 实际 上 是 函数 依赖 。 

在 关系 模式 STORE 中 ,W 一 一 S,W 一 了 ,它们 都 是 非 平凡 的 多 值 依赖 。 而 W 不 是 
码 , 关 系 模式 STORE 的 码 是 (W.S.,P), 即 全 码 。 因 此 STOREG 4NF。 

解决 办 法 是 进行 投影 分 解 ,消去 非 平凡 且 非 函数 依赖 的 多 值 依赖 。 例 如 ,把 STORE 分 
解 为 WS(W,S) 和 WCCW,P)。 在 WS 中 虽然 有 W 一 一 S, 但 这 是 平凡 的 多 值 依赖 ,WS 中 
已 不 存在 非 平凡 且 非 函数 依赖 的 多 值 依赖 ,所 以 WSE4NF, 同 理 WPE4NF。 

函数 依赖 和 多 值 依赖 是 两 种 最 重要 的 数据 依赖 。 如 果 只 考虑 函数 依赖 , 则 属于 BCNF 
的 关系 模式 规范 化 程度 已 经 是 最 高 的 了 ; 如 果 考 虑 多 值 依赖 , 则 属于 4NF 的 关系 模式 规范 
化 程度 是 最 高 的 。 
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4.3.6 多 值 依 赖 和 第 五 范式 
1. 连接 依赖 


在 数据 依赖 中 ,除了 函数 依赖 和 多 值 依赖 以 外 ,还 有 一 种 连接 依赖 。 但 连接 依赖 不 像 函 
数 依赖 和 多 值 依 赖 可 由 语义 直接 导出 ,而 是 在 关系 的 连接 运算 中 才能 反映 出 来 。 存 在 连接 
依赖 的 关系 模式 同样 会 遇 到 数据 宛 余 和 更 新 异常 的 情况 ,如 果 在 4NF 的 基础 上 进一步 投影 
分 解 ,消除 连接 依赖 ,就 成 为 了 5NF 。 目 前 ,5NF 是 数据 库 的 最 高 范式 。 

定义 4.14 设 Xi ，Xs*，…，X, 是 关系 R 的 属性 子 集 , 且 XU X:U…UX,=U。 若 对 
R 的 任 一 取 值 ,R 二 RCX1)PI R(Xs)BI…PBAR (CX,) 均 成 立 , 则 称 尺 具有 连接 依赖 , 记 为 4 
KR 

如 果 X; 二 U(i 二 1,2,…,n), 则 连接 依赖 总 是 成 立 的 ,这 称 为 平凡 连接 依赖 ,否则 称 为 非 
平凡 连接 依赖 。 平 凡 连 接 依 赖 无 实际 意义 。 多 值 依赖 可 以 看 成 是 连接 依赖 的 一 个 特例 。 一 
般 的 连接 依赖 不 容易 直观 地 从 数据 语义 中 发 现 , 是 一 种 普遍 化 程度 较 高 的 数据 依赖 ,在 数据 
库 设计 中 ,几乎 不 需要 考虑 这 种 数据 依赖 ,因为 它 对 数据 库 性 能 的 影响 不 大 ,而 且 考 虑 到 数 
据 库 的 查询 效率 ,一 般 允 许 这 样 的 数据 依赖 存在 。 


2. 第 五 范式 


如 果 关 系 模式 RE 4NF, 且 除了 由 超 键 (包含 一 个 候选 关键 字 的 属性 组 ) 构 成 的 连接 依 
赖 外 , 别 无 其 他 连接 依赖 , 即 R 中 每 一 个 连接 依赖 均 由 R 的 候选 码 所 隐 含 , 则 称 关 系 模式 玉 
是 5NF, 即 RE5NF。 

所 谓 尺 中 每 一 个 连接 依赖 均 由 尺 的 候选 码 所 隐 含 是 指 在 连接 时 ,其 连接 属性 必须 是 民 
的 候选 码 。 下 面 来 看 一 个 不 是 5NF 的 关系 模式 : 

提供 (供应 商号 ,零件 号 ,工程 号 ); 
其 中 ,唯一 的 候选 码 是 全 码 { 供 应 商号 ,零件 号 ,工程 号 }, 且 该 关系 模式 可 不 丢失 数据 地 
投影 分 解 成 三 个 关系 模式 : 供应 (供应 商号 ,零件 号 人 零件 号 ) 和 承接 (供应 商 
号 ,工程 号 ), 而 这 三 个 关系 模式 不 包含 原 关系 的 候选 码 ,所 以 原 关 系 不 是 5NF 的 ,而 且 原 关 
系 模式 也 不 是 4NF 的 。 

接 下 来 再 看 一 个 属于 5NF 的 关系 模式 : 

Es 号 ,姓名 ,性 别 ,年 龄 ,来 自 地 区 ， bh 

然 该 关系 是 4NF 的 , 且 其 候选 码 只 有 一 个 {学 号 } ,而 关系 模式 满足 的 所 有 连接 依赖 

i re 

任何 关系 模式 总 是 可 以 无 损失 地 投影 分 解 成 一 组 5NF 的 关系 ,同时 又 可 以 用 连接 来 重 
构 原 关 系 模式 ,因此 5NF 相对 于 投影 和 连接 运算 来 说 已 是 最 高 范式 。 


4.3.7 规范 化 过 程 小 结 


规范 化 : 把 低 一 级 的 关系 模式 通过 模式 分 解 ,转化 为 若干 个 高 一 级 范式 的 关系 模式 的 
集合 的 过 程 。 
目的 : 解决 关系 模式 存在 的 插入 、 删 除 异常 ,修改 复杂 ,数据 元 余 等 问题 。 
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基本 思想 :“ 分 离 ”“ 一 事 一 地 ”。 让 一 个 关系 描述 一 个 概念 一 个 实体 或 者 实体 间 的 一 
种 联系 。 若 多 于 一 个 概念 则 把 它 “ 分 离 ” 出 去 。 

实质 : 概念 的 单一 化 。 

步骤 : 分 解 关系 模式 ,把 低 一 级 的 关系 模式 分 解 为 若干 个 高 一 级 的 关系 模式 (如 图 4-2 
所 示 )。 这 种 分 解 不 唯一 。 


1NF 
消除 非 主 属性 对 码 的 部 分 函数 依赖 
1 
2NF 
消除 决定 因素 消除 非 主 属性 对 码 的 传递 函数 依 
兴办 下 | RH 近 人 
函数 依赖 a 
| 浓 队 二 民 性 村 到 风 部 分 和 传闻 政信 和 
BCNF 
消除 非 平凡 且 非 函数 依 燥 的 多 值 依 下 


时 
4NF 


1 
5NF 


图 4-2 关系 模式 分 解 与 规范 化 的 关系 


G4 关系 模式 的 分 解 


一 个 不 合适 的 关系 模式 存在 着 数据 存储 和 操作 的 问题 ,解决 方法 是 将 关系 模式 规范 化 ， 
实际 上 ,规范 化 过 程 是 将 一 个 关系 模式 分 解 成 多 个 规范 化 的 关系 模式 的 过 程 。 


4.4.1 关系 模式 分 解 的 标准 


一 个 关系 模式 RC(U,F)( 其 中 U 为 R 的 属性 的 集合 ,为 R 的 函数 依赖 集合 ) 分 解 为 车 
干 个 关系 模式 RU ,Fi ) ,R2(Us ,Fi),…,RxCUk ,Fk), 其 中 UU=UUUsU…UUx, 且 不 
存在 UU; ,Fi 是 F 在 U; 上 的 投影 ,这 意味 着 相应 地 将 存储 在 二 维 表 工 中 的 数据 分 散 到 
若干 个 二 维 表 T1,T。,…,T 中 去 (其 中 T; 是 T 在 属性 组 U; 上 的 投影 )。 我 们 希望 这 样 的 
分 解 不 丢失 信息 ,也 就 是 说 ,希望 能 通过 对 关系 ,rs。，,… ,ri 的 自然 连接 运算 ,重新 得 到 关系 
rr 中 的 所 有 信息 。 

当然 ,在 分 解 时 关心 的 是 分 解 后 的 关系 模式 是 否 能 准确 地 反映 原 关 系 模式 的 所 有 信息 ， 
并 且 不 会 增加 不 存在 的 信息 , 即 一 方面 要 求 分 解 后 的 关系 模式 经 过 某 种 连接 操作 后 和 原 关 
系 模式 的 记录 相同 , 既 没有 增加 也 没有 减少 (无 损 连 接 ), 另 一 方面 要 求 分 解 以 后 的 关系 模式 
保持 了 原 关系 模式 中 的 函数 依赖 (保持 依赖 ) ,这 是 关系 模式 分 解 的 原则 。 

规范 化 过 程 中 将 一 个 关系 模式 分 解 为 若干 个 关系 模式 ,应 该 保证 分 解 后 产生 的 模式 与 
原来 的 模式 等 价 。 通 常 关系 模式 分 解 等 价 标准 是 : 要 求 分 解 是 具有 无 损 连 接 性 ; @ 要 求 
分 解 是 保持 函数 依赖 的 。 
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4.4.2 无 损 连接 性 


设 关系 模式 R(U,F)( 其 中 UU 为 R 的 属性 的 集合 ,下 为 R 的 函数 依赖 集合 ) 分 解 为 若干 
个 关系 模式 Ri(Ui ,Fi) ,Rs (Uz ,Fo),…,Rk (Uk ,Fk), 其 中 U=UUUsU…UUx, 且 不 存 
在 U;SU,,F; 是 F 在 U; 上 的 投影 。 若 尺 与 Ri,R,,Rk 自然 连接 的 结果 相等 , 则 称 关系 RR 
的 这 个 分 解 具有 无 损 连 接 性 (lossless join) 。 

只 有 具有 无 损 连接 性 的 分 解 才能 保证 不 丢失 信息 。 

例如 ,关系 模式 R(A,B,C,D,E), 其 函数 依赖 关系 为 A->B,A-C,A 一 D,C 一 D, D> 
E。 可 以 将 尺 分 解 为 Ri(A),R,(B) ,Rs;(C),R,(D) 和 R;(E), 这 一 定 是 具有 无 损 连接 性 的 
分 解 。 但 是 ,这 不 是 一 个 好 的 分 解 ,因为 它 没有 保持 函数 依赖 。 


4.4.3 保持 函数 依赖 


设 关系 模式 RCU,F)( 其 中 UU 为 R 的 属性 的 集合 ,F 为 R 的 函数 依赖 集合 ) 分 解 为 若干 
个 关系 模式 Ri (CU ,Pi) ,Rs (U2 ,Fs),…,Rk(Uk ,Fr), 其 中 U=UUU:U…UUr, 且 不 存 
在 USUj,F; 是 F 在 U; 上 的 投影 。 若 下 所 人 逻辑 蕴涵 的 函数 依赖 一 定 也 由 分 解 得 到 的 某 个 
关系 模式 中 的 函数 依赖 F; 所 人 逻辑 蕴涵 , 则 称 关 系 R 的 这 个 分 解 是 保持 函数 依赖 的 
(preserve dependency) 。 

例如 ,关系 模式 RC(A,B,C,D.E), 其 函数 依赖 关系 为 A 一 B,A 一 C,A 一 D,C 一 D,D 一 
EE。 将 尺 分 解 ,Ri1(A,B,C,D) 和 Rs(D.E), 这 是 保持 函数 依赖 的 分 解 ,还 可 以 进一步 分 解 
为 RC(A,B,C,D)、R,(C,D) 和 Rs(D,E), 这 也 是 保持 函数 依赖 的 分 解 ,因为 R 的 函数 依赖 
集 F={A 一 B,A 一 C,A 一 D,C>D,B 一 E) .Ri 的 函数 依赖 集 二 { A 一 B,A 一 C } ,R; 的 函 
数 依赖 集 Fi 二 { CD ) ,Rs 的 函数 依赖 集 FF 二 { D>E },F 所 蕴涵 的 每 个 函数 依赖 关系 均 
被 记 、F;、F; 之 一 所 蕴涵 。 

为 了 提高 规范 化 程度 ,通常 是 通过 将 低 一 级 的 关系 模式 分 解 为 若干 个 高 一 级 的 关系 模 
式 来 实现 ,分 解 过 程 存 在 如 下 情况 : 

(1) 分 解 具有 无 损 连 接 性 和 保持 函数 依赖 性 是 两 个 互相 独立 的 分 解 标 准 。 具 有 无 损 连 
接 性 的 分 解 不 一 定 保持 函数 依赖 ; 保持 函数 依赖 的 分 解 不 一 定 具有 无 损 连接 性 。 

(2) 若 要 求 分 解 具有 无 损 连接 性 ,那么 模式 分 解 一 定 可 以 达到 BCNF。 

(3) 车 要 求 分 解 保持 函数 依赖 ,那么 模式 分 解 可 以 达到 3NF ,但 不 一 定 能 达到 BCNF。 


人 5 在 实际 数据 库 设计 中 关系 规范 化 的 应 用 


4.5.1 关系 规范 化 的 基本 原则 


一 个 低级 范式 的 关系 模式 ,通过 关系 模式 的 投影 分 解 ,可 以 转换 为 若干 个 高 一 级 范式 的 
关系 模式 的 集合 ,这 种 过 程 就 叫 规范 化 。 其 基本 思想 是 : 逐步 消除 数据 依赖 中 不 合适 的 部 
分 ,使 各 关系 模式 达到 一 定 程度 的 分 离 . 即 “一 事 一 地 ”的 模式 设计 原则 ,使 概念 单一 化 , 即 让 

个 关系 描述 一 个 概念 ,一 个 实体 或 者 实体 间 的 一 种 联系 。 
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规范 化 的 程度 越 高 ,数据 的 元 余 和 更 新 异常 就 越 少 ,但 由 于 连接 运算 费时 ,查询 时 所 
花 的 时 间 也 就 越 多 。 因 此 ,规范 化 宜 根据 具体 情况 权衡 利弊 ,适可而止 ,对 于 数据 变动 不 
频繁 的 数据 库 ,其 规范 化 程度 可 以 低 一 些 。 实 际 工作 中 ,一 般 达 到 多 数 关 系 模式 为 3NF 
即 可 。 

值得 注意 的 是 ,规范 化 仅仅 从 一 个 侧面 提供 了 改善 关系 模式 的 理论 和 方法 。 一 个 关系 
模式 的 好 坏 ,规范 化 是 衡量 的 标准 之 一 ,但 不 是 唯一 的 标准 。 数 据 库 设计 者 的 任务 是 在 一 定 
的 制约 条 件 下 ,寻求 能 够 较 好 地 满足 用 户 需求 的 关系 模式 。 规 范 化 的 程度 不 是 越 高 越 好 ,这 
取决 于 应 用 。 
根据 关系 数据 库 设 计 理 论 , 优 化 关系 数据 库 设计 的 过 程 ,实际 上 就 是 对 关系 模式 进行 规 
范 化 的 过 程 , 即 不 断 通过 投影 分 解 使 非 规范 化 的 关系 模式 达到 规范 化 的 要 求 。 前 面 已 给 出 
了 许多 分 解 关系 模式 的 例子 。 一 般 地 说 ,关系 模式 R(Al，A;，A;,… ,A,) 的 分 解 就 是 用 R 
的 一 组 子 集 {R，R: ，R: ,Re) 来 代 蔡 尺 , 且 这 组 子 集 满足 条 件 : 

R=R, U R; Wass UR 

其 中 ,任意 两 个 子 集 R; 和 R; 相互 的 交 不 要 求 为 空 , 即 它们 可 以 有 共同 的 属性 。 通 过 分 
解 , 可 消除 数据 元 余 , 从 而 消除 插入 、 删 除 或 更 新 的 异常 。 对 于 关系 分 解 ,不仅 要 求 消除 数据 
宛 余 ,还 要 求 分 解 后 的 关系 模式 和 分 解 前 的 关系 模式 能 表示 相同 的 信息 。 

在 关系 模式 规范 化 时 一 般 应 遵循 以 下 原则 : 

(1) 关系 模式 进行 无 损 连 接 分 解 。 关 系 模 式 分 解 过 程 中 数据 不 能 丢失 或 增加 ,必须 把 
全 局 关系 模式 中 的 所 有 数据 无 损 地 分 解 到 各 个 子 关系 模式 中 ,以 保证 数据 的 完整 性 。 

(2) 合理 选择 规范 化 程度 。 若 考虑 到 存 取 效率 ,低级 范式 造成 的 宛 余 度 很 大 , 既 浪费 了 
存储 空间 ,又 影响 了 数据 的 一 致 性 ,因此 希望 一 个 子 模式 的 属性 越 少 越 好 , 即 取 高 级 范式 ; 
若 考 虑 到 查询 效率 ,低级 范式 又 比 高 级 范式 好 ,此 时 连接 运算 的 代价 较 小 。 这 是 一 对 矛盾 ， 
所 以 应 根据 实际 情况 ,合理 选择 规范 化 程度 。 

(3) 正确 性 与 可 实现 性 原则 。 


4.5.2 关系 规范 化 的 实际 应 用 


在 上 节 提 到 的 关系 模式 规范 化 的 过 程 是 : 假定 先 用 某 种 方法 得 到 一 个 关系 数据 库 的 模 
式 , 然 后 分 析 和 确定 这 个 数据 库 模式 上 的 所 有 存在 的 函数 依赖 ,甚至 包括 多 值 依赖 关系 ,再 
用 相对 机 械 的 方法 进行 关系 模式 的 分 解 ,消除 关系 模式 中 的 一 些 不 适当 的 数据 依赖 关系 ,从 
而 将 关系 数据 库 模式 规范 化 。 这 是 理论 上 的 做 法 ,而 在 实际 应 用 中 并 不 完全 这 样 做 。 其 主 
要 原因 在 于 : 

第 一 , 找 出 所 有 数据 依赖 关系 不 是 一 件 简单 的 事 ,如 果 漏 掉 了 或 错误 地 确定 了 一 些 数据 
依赖 关系 , 按 上 节 的 方法 进行 关系 规范 化 ,不 能 得 到 一 个 在 理论 上 认为 好 的 数据 库 设计 。 

第 二 ,即使 能 正确 地 找 出 所 有 的 数据 依赖 关系 ,采用 机 械 地 分 解 模式 的 方法 ,而 完全 不 
考虑 关系 的 具体 大 小 :以 及 数据 的 动态 特征 (比如 数据 是 经 常 更 新 的 ,还 是 很 少 更 新 的 ) ,全 
部 规范 化 到 同样 的 程度 (比如 3NF) ,这 也 是 不 适当 的 。 

第 三 ,数据 库 设 计 一 般 采用 先 得 到 现实 环境 的 E-R 模型 ,再 由 E-R 模型 转换 得 到 关系 
数据 库 模式 的 方法 。 从 E-R 模型 转换 生成 的 关系 模式 ,很 少 有 较 大 关系 模式 (包含 属性 较 
多 ) ,由 于 E-R 模型 中 往往 实体 集合 分 得 较 细 ,转换 得 到 的 关系 模式 较 小 (包含 属性 较 少 )， 
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为 了 以 后 数据 库 查询 的 方便 ,更 多 的 情况 是 需要 合并 关系 模式 ,而 不 是 分 解 关系 模式 。 因 
此 ,在 实际 应 用 中 ,要 得 到 一 个 好 的 数据 库 设计 ,需要 根据 具体 情况 对 关系 模式 进行 处 理 , 既 
可 能 要 合并 关系 模式 ,也 可 能 要 分 解 关系 模式 。 

当然 ,这 并 不 意味 着 关系 规范 化 的 理论 在 实际 的 数据 库 设 计 中 就 没有 意义 , 它 对 关系 数 
据 库 模式 的 设计 仍然 起 着 指导 作用 。 当 设计 E-R 模型 时 ,以 及 由 E-R 模型 转换 生成 关系 模 
式 后 ,在 进行 关系 模式 优化 设计 的 过 程 中 ,关系 的 规范 化 理论 能 够 帮助 用 户 得 到 较 好 的 数据 
库 设计 。 在 设计 E-R 模型 时 ,应 仔细 分 析 数 据 间 存 在 的 函数 依赖 和 多 值 依赖 ,这 样 能 使 
户 最 后 从 E-R 模型 得 到 的 关系 数据 库 模式 基本 达到 3NF 的 规范 程度 。 

数据 之 间 的 函数 依赖 是 现实 世界 中 客观 存在 的 ,数据 依赖 关系 的 确定 最 好 在 系统 分 析 
期 间 , 在 生成 ER 模型 的 过 程 中 完成 ,而 不 必 在 已 经 得 到 关系 数据 库 模 式 后 ,再 去 寻找 有 加 
些 数据 依赖 关系 存在 。 实 际 上 ,在 生成 E-R 模型 时 确定 数据 之 间 的 依赖 关系 更 为 容易 , 因 
为 尽管 ER 模型 本 身 并 不 包括 函数 依赖 和 多 值 依赖 等 概念 ,但 E-R 模型 更 接近 于 现实 世 
界 。 例 如 , 当 确 定 了 一 个 实体 集合 和 它 的 属性 后 ,自然 就 确定 了 属性 对 实体 集合 的 依赖 
关系 ,以 及 实体 集合 非 关 键 字 属 性 对 实体 集合 关键 字 属 性 的 依赖 关系 ; 类 似 地 ,如 果 联 系 
及 表示 从 实体 集合 El 到 实体 集合 E2 的 多 对 一 联系 ,广义 地 ,可 以 说 实体 集合 El 决定 了 
实体 集合 E2, 在 转化 为 关系 模式 后 ,联系 RR 形成 的 关系 模式 的 属性 集合 中 有 El 的 关键 
字 和 E2 的 关键 字 Y, 则 有 XX 一 Y 成 立 ,而 且 六 决定 了 R 的 任何 一 个 属性 集 ,车 El 和 
EE2 之 间 的 联系 是 一 对 一 的 , 则 Y-~X 也 成 立 。 所 以 ,在 E-R 模型 中 是 隐 含 着 许多 数据 依 
赖 关系 的 。 

在 E-R 模型 中 ,任何 事物 ,数据 或 知识 等 都 可 以 是 实体 ,实体 的 属性 是 实体 某 一 方面 的 
特征 , 它 完 全 可 能 有 非常 复杂 的 结构 ,而 且 属 性 之 间 可 能 存在 各 种 各 样 的 数据 依赖 关系 。 由 
于 建立 E-R 模型 的 目的 是 最 终生 成 关系 数据 库 模 式 ,而 在 关系 数据 库 模式 中 不 能 描述 复杂 
结构 的 属性 ,因此 , 当 发 现实 体 有 结构 复杂 的 属性 时 ,通常 要 在 E-R 模型 中 加 入 新 的 实体 来 
解决 这 个 问题 。 这 就 相当 于 将 非 NF 的 关系 模式 规范 为 INF 的 关系 模式 的 工作 ,但 这 里 通 
常 不 是 把 嵌 套 的 属性 (或 称 为 子 表 )“ 展 开 ”, 使 媒 套 属性 成 为 原子 属性 ,而 是 将 一 个 实体 “分 
解 ”成 多 个 新 实体 ,将 具有 复杂 结构 的 属性 处 理 成 实体 。 类 似 地 , 当 发 现 一 实体 内 的 属性 之 
间 存 在 除 对 关键 字 属 性 的 完全 函数 依赖 以 外 的 函数 依赖 ,或 者 分 析 插 入 、 删 除 等 动态 特性 发 
现 有 可 能 发 生 异 常 时 ,也 试图 发 现 新 实体 ,并 将 其 增加 到 E-R 模型 中 ,以 消除 这 些 函 数 依 
赖 。 当 然 ,是 否 一 定 需要 消除 这 些 函 数 依赖 ,还 要 综合 考虑 数据 宛 余 和 数据 的 动态 特性 (做 
择 入、 删除、 修改 的 频率 ) ,因为 函数 依赖 多 ,数据 元 余 就 多 ,但 数据 的 查询 代价 小 。 一 般 , 凡 
是 因为 保留 数据 依赖 而 造成 数据 元 余 的 ,都 应 设计 数据 库 触 发 器 或 其 他 设施 ,来 保证 在 插 
入 删除 、 修 改 时 数据 的 一 致 性 ,以 避免 任何 异常 的 出 现 。 事实 上 ,只 要 在 进行 系统 需求 分 析 
时 ,对 企业 或 组 织 的 分 析 很 全 面 ,细致 和 正确 ,不 遗漏 任何 实体 ,就 有 可 能 消除 “多 余 ” 的 函数 
依赖 ,得 到 E-R 模型 转化 成 的 关系 模式 基本 上 是 3NF。 

从 E-R 模型 转化 为 关系 模型 后 , 常 合并 一 些 关 系 以 求 模型 简单 , 易 用 。 合 并 关系 时 应 
注意 不 要 产生 “多 余 ” 的 函数 依赖 ,以 免 造 成 数据 元 余 。 合 并 关键 字 相 同 的 关系 模式 不 会 产 
生 数 据 元 余 ; 合并 存在 外 部 关键 字 约束 的 两 个 关系 模式 , 则 会 产生 数据 元 余 , 因 此 是 否 合并 
就 应 做 综合 权衡 。 


第 4 章 ”关系 数据 理论 


人 6 本 章 小 结 


本 章 讨论 关系 数据 理论 。 要 设计 好 的 数据 库 模式 ,必须 有 模式 设计 理论 为 基础 。 规 范 
化 设计 理论 对 关系 数据 库 结构 的 设计 起 着 重要 的 作用 。 

函数 依赖 是 对 关系 中 属性 值 之 间 多 对 一 的 描述 ,也 是 对 关系 中 值 的 一 种 约束 。 它 是 对 
关键 码 概念 的 扩充 。 

范式 是 衡量 模式 优 劣 的 标准 。 范 式 的 级 别 越 高 ,其 数据 元 余 和 操作 异常 现象 就 越 少 。 

关系 模式 的 规范 化 过 程 就 是 把 低 一 级 的 关系 模式 通过 模式 分 解 , 转 化 为 若干 个 高 一 级 
范式 的 关系 模式 的 集合 的 过 程 。 其 目的 是 解决 关系 模式 中 存在 的 插入 、 删 除 异常 .修改 复 
杂 , 数 据 元 余 等 问题 。 

关系 模式 在 分 解 时 ,应 该 保证 分 解 后 产生 的 模式 与 原来 的 模式 等 价 。 通 常 关 系 模 式 分 
解 等 价 分 别 用 无 损 连 接 性 和 保持 函数 依赖 两 个 特征 来 衡量 。 


.7 习题 


4.7.1 名 词 解释 


关系 模式 的 规范 化 、 函 数 依赖 、 部 分 函数 依赖 、 完 全 函数 依赖 、 传 递 依 赖 、 修 选 码 、 主 码 、 
外 码 ,全 码 .INF .2NF .3NF .BCNF 


4.7.2 简 答题 


1. 数据 存储 异常 包括 哪 几 类 ? 
2， 简 述 关 系 无 损 连 接 性 和 保持 函数 依赖 之 间 的 联系 。 


4.7.3 综合 题 


1. 设 关系 模式 R(A,B,C,D) ,其 函数 依赖 关系 为 {A~~C,C 一 A,B 一 AC,D~~AC,BD 一 
A} , 求 出 关系 模式 R 的 候选 码 ; 将 R 分 解 为 3NF, 使 其 既 具 有 无 损 连 接 性 又 具有 函数 依赖 
保持 性 。 

2. 设 关系 模式 R(A,B,C,D,E,F) ,其 函数 依赖 关系 F={AB 一 E,BC 一 D, BE 一 C， 
CD 一 B,CE 一 AF,CF>BD, C~>A, D>EF }), 求 下 的 最 小 函数 依赖 集 。 

3. 设 关系 模式 R(A,B,C.D) ,其 函数 依赖 关系 下 二 {AB 一 CD,A 一 D }, 试 说 明 尺 不 是 
2NF 模式 的 理由 ,并 把 RR 分 解 成 2NF 模式 集 。 

4. 设 有 关系 模式 尺 ( 员 工 名 ,项 目 名 ,工资 ,部门 名 ,部门 经 理 ) ,规定 每 个 员工 可 参加 多 
个 项 目 建设 ,各 领 一 份 工资 ; 每 个 项 目 只 属于 一 个 部 门 管理 ; 每 个 部 门 只 有 一 个 经 理 。 

(1) 写 出 关系 模式 R 的 基本 函数 依赖 和 关键 码 。 

(2) 说 明 RR 不 是 2NF 模式 的 理由 ,并 把 RR 分 解 成 2NF 模式 集 。 

(3) 进而 把 尺 分 解 成 3NF 模式 集 , 并 说 明理 由 。 
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5. 设 有 关系 模式 R( 员 工 名 ,项 目 名 ,工资 ,部 门 名 ,部 门 经 理 ) ,规定 每 个 员工 可 参加 多 
个 项 目 建设 ,各 领 一 份 工 资 ; 每 个 项 目 只 属于 一 个 部 门 管理 ; 每 个 部 门 只 有 一 个 经 理 。 

(1) 试 写 出 关系 模式 R 的 基本 函数 依赖 和 关键 码 。 

(2) 说 明 R 不 是 2NF 模式 的 理由 ,并 把 R 分 解 成 2NF 模式 集 。 

(3) 进而 把 尺 分 解 成 3NF 模式 集 , 并 说 明理 由 。 

6. 判断 下 面 的 关系 模式 是 不 是 BCNF ,并 说 明理 由 。 

(1) 任何 一 个 二 元 关系 ; 

(2) 关系 模式 R(A,B,C,D,E,F) ,函数 依赖 集 {(A BC, BC 一 A,BCD 一 EF,E 一 C)。 

7. 设 有 关系 模式 R(A,B,C) ,其 函数 依赖 关系 二 {AB->C,C 一 一 A),R 属于 第 几 范 
式 , 为 什么 ? 

8. 下 列 结论 哪些 是 正确 的 ? 哪些 是 错误 的 ? 对 于 错误 的 请 给 出 一 个 反例 。 

(1) 任何 一 个 二 元 关系 都 是 属于 3NF 的 。 

(2) 任何 一 个 二 元 关系 都 是 属于 BCNF 的 。 

(3) 任何 一 个 二 元 关系 都 是 属于 4NF 的 。 
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关系 查询 处 理 与 优化 | 


本 章 主要 介绍 关系 型 数据 库 系统 的 查询 优化 技术 。 查 询 优化 技术 在 关系 型 数据 库 中 有 
着 非常 重要 的 作用 ,关系 型 数据 库 系统 和 非 过 程 化 SQL 语言 的 巨大 成 功 ,得 益 于 查询 优化 
技术 的 发 展 ,查询 优化 是 影响 RDBMS 性 能 的 重要 因素 ,也 是 其 优势 所 在 。 本 章 将 介绍 关系 
型 数据 库 的 查询 优化 方法 及 相关 问题 ,将 使 读者 初步 了 解 RDBMS 查询 的 基本 处 理 过 程 ,以 
及 查询 优化 的 基本 概念 和 基本 方法 ,并 给 出 了 一 些 在 实际 应 用 中 的 查询 优化 方法 。 


G1 查询 优化 概述 


查询 优化 对 关系 型 系统 来 说 既是 挑战 又 是 机 遇 。 所 谓 挑战 是 指 关 系 系统 为 了 达到 用 户 
可 接受 的 性 能 必须 进行 查询 优化 。 由 于 关系 表达 式 的 语义 级 别 很 高 ,使 得 关系 系统 能 够 从 
关系 表达 式 中 分 析 查 询 语义 ,提供 了 查询 优化 的 可 行 性 。 这 为 关系 系统 在 性 能 上 接近 其 至 
超过 非 关系 系统 提供 了 机 遇 。 

本 节 主 要 讨论 查询 优化 问题 的 背景 ,查询 优化 的 必要 性 和 在 关系 数据 库 中 进行 查询 的 
可 行 性 。 


5.1.1 查询 中 遇 到 的 问题 


数据 查询 是 数据 库 系统 中 的 最 基本 、 最 常用 和 最 复杂 的 数据 操作 ,从 实际 应 用 的 角度 
看 ,必须 考察 系统 用 于 查询 处 理 的 开销 代价 。 查 询 处 理 的 代价 通常 取决 于 查询 过 程 对 磁盘 
的 访问 ,磁盘 访问 速度 相对 于 内 存 速度 要 慢 很 多 。 在 数据 库 系 统 中 ,用 户 的 查询 通过 相应 的 
查询 语句 提交 给 DBMS 执行 。 一 般 而 言 , 相 同 的 查询 要 求 和 结果 存在 着 不 同 的 实现 策略 ， 
在 执行 这 些 查询 策略 时 系统 所 付出 的 开销 代价 通常 有 很 大 差别 ,甚至 可 能 会 相差 几 个 数量 
级 。 实 际 上 ,对 于 任何 一 个 数据 库 系统 来 说 ,查询 处 理 都 是 必须 要 面 对 的 ,如 何 从 查询 的 多 
个 实现 策略 中 进行 合理 的 选择 ,这 种 选择 过 程 就 是 查询 处 理 过 程 的 优化 ,简称 查询 优化 。 

查询 优化 作为 数据 库 中 的 关键 技术 ,对 数据 库 的 性 能 需求 和 实际 应 用 有 着 重要 的 意义 。 

查询 是 数据 库 的 最 主要 的 功能 ; 数据 查询 必然 会 有 查询 优化 的 问题 ; 从 对 数据 库 的 性 
能 要 求 和 使 用 技术 的 角度 来 看 ,在 任何 一 种 数据 库 中 都 要 有 相应 的 处 理 方法 和 途径 。 查 询 
优化 的 基本 途径 可 以 分 为 用 户 手动 处 理 和 机 器 自动 处 理 两 种 。 

关系 型 数据 库 系 统 中 ,查询 优化 也 是 必须 面 对 的 挑战 。 关 系数 据 理论 基于 集合 论 ,集合 
及 其 相关 理论 构成 了 整个 关系 数据 库 领 域 中 最 重要 的 理论 基础 ,这 给 关系 数据 查询 优化 处 
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理 在 理论 上 提供 了 讨论 的 可 行 性 ; 关系 查询 语言 作为 高 级 语言 ,具有 较 高 层次 的 语义 特性 ， 
为 机 器 处 理 查 询 优化 问题 在 实践 上 提供 了 可 能 性 。 


5.1.2 查询 优化 的 必要 性 


一 个 好 的 查询 计划 往往 可 以 使 程序 性 能 提高 数 十 倍 , 查 询 计划 是 用 户 所 提交 的 SQL 语 
句 的 集合 。DBMS 处 理 查询 计划 的 过 程 是 这 样 的 : 在 做 完 查询 语句 的 词法 、 语 法 、 语 义 检查 
之 后 ,将 语句 提交 给 DBMS 的 查询 优化 器 ,优化 器 做 完 代 数 优 化 和 存 取 路 径 优化 之 后 ,由 预 
编译 模块 对 语句 进行 处 理 并 生成 查询 规划 ,然后 在 合适 的 时 间 提 交 给 系统 处 理 执行 ,最 后 将 
执行 结果 返回 给 用 户 。 

下 面 通过 一 个 例子 来 说 明 查 询 优 化 的 必要 性 。 

【 例 5. 1】 在 关系 模式 SC 学生),C( 课 程 ),SC( 选 课 ) 中 ,查询 修 读 课程 号 为 C5 的 所 有 
学 生 姓名 。 

此 查询 的 SQL 查询 语言 的 语句 形式 为 : 


SELECT S. Sname FROM S, SC WHERE S. Sno = SC. Sno AND SC. Cno= 'C5'; 


系统 可 以 有 多 种 等 价 的 关系 代数 表达 式 来 完成 这 一 查询 。 一 般 而 言 , 在 SQL 语句 转换 
为 关系 代数 表达 式 的 过 程 中 ,SELECT 语言 对 应 投影 运算 ,FROM 语句 对 应 笛 卡 儿 乘积 运 
算 , WHERE 子 句 对 应 选择 运算 。 例 如 可 以 写 出 下 面 3 种 表达 式 : 
Qi = rsmme (as sm=sc.smAsc.co=G(SXSC)); 
Q: = rsmme (Gsc.cm=cs (SDASC)); 
Q: = Nsmme (SDAos.cwcs (SC))。 
当然 ,还 可 以 写 出 其 他 等 价 的 关系 代数 表达 式 ,但 只 要 分 析 以 上 式 子 就 可 以 说 明 问 题 。 
下 面 用 简单 的 方法 来 计算 这 3 种 表达 式 查 询 所 需 的 时 间 。 在 计算 前 先 做 如 下 的 统一 


约定 : 


设 S 有 1000 个 元 组 ,SC 有 10000 个 元 组 ,其 中 修 读 C5 的 元 组 数 为 50。 
磁盘 中 每 个 物理 块 能 存放 10 个 S 元 组 ,或 100 个 SC 元 组 。 

内 存 有 6 个 块 的 缓冲 区 ,其 中 5 块 可 以 存放 S 元 组 ,1 块 存 放 SC 元 组 。 
读 / 写 一 块 磁盘 的 时 间 为 1/20s, 即 1s 读 写 20 个 磁盘 块 。 

为 了 简化 起 见 , 所 有 内 存 操作 所 花 的 时 间 忽略 不 计 。 


1. 计算 Q1 的 查询 时 间 


(1) 首先 做 笛 卡 儿 乘积 

将 S 与 SC 的 每 个 元 组 相连 接 , 其 方法 为 先 读 和 人 S 中 的 50 个 元 组 (5X10) 至 S 表 中 的 
内 存 缓冲 区 ,然后 不 断 地 将 SC 的 元 组 按 100 位 一 块 读 和 后 与 S 的 元 组 相连 接 , 直 至 读 完 所 
有 SC 元 组 (共计 100 次 )。 这 种 操作 内 连接 满 100 位 后 就 写 中 间 文 件 一 次 。 反 复 进行 这 样 
的 操作 ,直至 做 完 笛 卡 儿 乘 积 , 此 时 共 读 取 总 块 数 为 : 


1000 ，_1000 、10 000 
两 “两 受 85” 和 0 


其 中 读 S 表 100 块 , 读 SC 表 20 次 ,每 次 100 块 。 由 于 每 块 花费 时 间 1/20s, 此 时 总 共 


一 100 十 20 X100 = 2100( 块 ) 
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花费 时 间 105s。 连 接 后 的 元 组 数 为 10; X10 二 107 , 设 每 块 ( 约 ) 能 装 10 个 元 组 , 则 写 和 中间 
文件 要 花 105/20 王 5X104s。 

(2) 其 次 做 选择 操作 

从 中 间 文 件 中 读 出 连接 后 的 元 组 , 按 选 择 要求 选 取 记 录 ( 此 项 为 内 存 操作 ,时 间 可 忽略 
否 计 ) ,此 项 操作 所 需 时 间 与 写 人 中 间 文 件 时 间 一 样 , 即 5X104s。 满 足 条 件 的 元 组 假设 为 
50 个 , 均 放 在 内 存 。 

(3) 最 后 做 投影 操作 

第 二 项 操作 的 结果 满足 条 件 的 元 组 数 为 50 个 ,它们 可 全 部 存放 在 内 存 。 对 它们 在 S 上 
做 投影 操作 ,由 于 是 在 内 存 中 进行 ,其 时 间 可 忽略 不 计 。 这 样 Qi 的 全 部 查询 时 间 为 
10 十 2X5X104s*105s。 注 意 到 一 天 为 86 400s, 所 以 这 个 运算 需要 超过 一 天 的 时 间 来 完成 。 


2. 计算 Q: 的 查询 时 间 


。 计算 自然 连接 : 计算 自然 连接 时 读 取 S 与 SC 表 的 方式 与 Qi 一 致 ,总 读 取 块 数 为 
2100 块 ,花费 时 间 为 105s, 但 其 连接 结果 块 数 大 为 减少 ,总 计 104 个 ,所 花 时 间 为 
104/10/20s 王 50s, 仅 为 Qi 的 千 分 之 一 。 

。 做 选择 操作 : 做 选择 操作 的 时 间 为 50s。 

。 做 投影 操作 : 与 Qi 类 似 , 其 时 间 可 忽略 不 计 。 

这 样 ,Q 的 全 部 查询 时 间 为 : 

105 十 50 十 50 = 205s 


3. 计算 Qs 的 查询 时 间 


。 对 SC 做 选择 操作 : 对 SC 表 做 选择 操作 需 读 SC 表 一 遍 共计 读 100 块 ,花费 5s, 因 
为 满足 条 件 的 元 件 只 有 50 个 ,不 必 使 用 中 间 文 件 。 
。 做 连接 运算 : 对 S 选择 后 的 SC 左 联接 运算 ,由 于 选择 后 的 SC 已 全 部 在 内 存 , 因 此 
全 部 操作 时 间 为 S 读 和 内存 的 时 间 共 100 块 ,花费 时 间 为 5s。 
。 做 投影 运算 : 其 时 间 忽 略 不 计 。 
这 样 ,Q 的 全 部 查询 时 间 为 : 
5 十 5 一 10s 
从 这 3 个 计算 时 间 可 以 看 出 ,3 种 等 价 的 查询 表达 式 具 有 完全 不 同 的 处 理 时 间 , 它 们 分 
别 是 10;s、205s 和 10s, 其 差距 之 大 令 人 瞳 目 。 
由 以 上 示例 可 知 ,对 于 关系 代数 等 价 的 不 同 表达 形式 而 言 ,相应 的 查询 效率 有 着 “数量 
级 ”上 的 重大 差异 。 这 是 一 个 十 分 重要 的 事实 , 它 说 明了 查询 优化 的 必要 性 , 即 合理 选取 查 
询 表达 式 可 以 获取 较 高 的 查询 效率 ,这 也 是 查询 优化 的 意义 所 在 。 


5.1.3 查询 优化 的 可 行 性 
我 们 知道 ,关系 数据 系统 查询 语句 表示 查询 操作 基于 集合 运算 ,一 般 称 之 为 关系 代数 。 
关系 代数 具有 5 种 基本 运算 ,这 些 运算 间 满 足 一 定 的 运算 定律 ,如 结合 律 .交换 律 ,分配 率 和 


串 接 率 等 ,这 就 意味 着 不 同 的 关系 代数 表达 式 可 以 得 到 同一 结果 ,因此 用 关系 代数 语言 进行 
查询 需要 进行 必要 的 优化 。 
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关系 查询 语句 与 普通 语言 相 比 有 坚实 的 理论 支撑 ,人 们 能 够 找到 有 效 的 算法 ,使 查询 优 
化 的 过 程 内 含 于 DBMS, 由 DBMS 自动 完成 ,从 而 将 实际 上 的 “过 程 性 ?向 用 户 “ 屏 项 ”, 用 户 
只 需 提 出 “和 干什么”, 而 不 必 指 出 “怎么 干 ”, 这 样 用 户 在 编程 时 只 需 表示 出 所 需要 的 结果 ,不 
必 给 出 获得 结果 的 操作 步骤 。 从 这 种 意义 上 讲 ,关系 查询 语言 是 一 种 高 级 语言 ,这 给 查询 优 
化 提供 了 可 能 性 。 


G2 查询 处 理 过 程 


在 关系 型 数据 库 中 ,查询 处 理 过 程 通常 可 以 分 为 四 个 阶段 : 查询 分 析 ,查询 处 理 , 查 询 
优化 和 查询 执行 ,如 图 5-1 所 示 。 


查询 分 析 
(词法 分 析 、 语 法 分 析 、 符 号 识别 ) 


数据 库 


查询 检查 
(语义 检查 、 全 完整 性 检查 ) 
数据 字典 


本 tree) 


站 


(查询 优化 加 进行 优化 ) 


查询 计划 


0 


(人 克成 区 ) 


执行 查询 的 代码 


图 5-1 关系 数据 库 查询 处 理 步 又 


5.2.1 查询 分 析 


查询 分 析 要 对 查询 语句 进行 扫描 、 词 法 分 析 和 语法 分 析 。 从 查询 语句 中 识别 出 语言 多 
号 ,如 SQL 关键 字 、 属 性 和 关系 名 称 等 ,并 进行 语法 检查 和 分 析 ,检查 语 句 是 否 符合 SQL 语 
法 规则 。 


5.2.2 查询 检查 


查询 检查 首先 根据 数据 字典 对 合法 的 查询 语句 进行 语义 检查 ,检查 语句 中 识别 出 的 语 
言 符号 在 数据 库 中 是 否 存 在 ,是 否 有 效 。 还 要 根据 数据 字典 中 的 用 户 权 限 和 完整 性 约束 定 
义 对 用 户 进行 检查 ,如 果 用 户 不 具备 相应 的 访问 权限 或 者 违反 了 完整 性 约束 原则 ,就 拒绝 执 
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行 该 查询 。 检 查 通过 后 ,把 查询 语句 转化 成 为 等 价 的 关系 代数 表达 式 。 在 RDBMS 中 一 般 
都 用 查询 树 (query tree)( 也 称 为 语法 分 析 树 (syntax tree)) ,来 作为 查询 的 内 部 表示 形式 。 


5.2.3 查询 优化 


每 个 查询 都 会 有 多 种 可 供 选择 的 执行 策略 和 操作 算法 ,查询 优化 就 是 选择 一 个 高 效 的 
查询 处 理 策略 。DBMS 会 调用 系统 的 优化 处 理 器 制定 一 个 执行 策略 ,由 此 产生 一 个 查询 计 
划 , 其 中 包括 了 如 何 防伪 数据 库 文件 和 如 何 存 储 中 间 结 果 等 。 

对 于 关系 型 数据 库 来 说 ,查询 优化 过 程 是 由 RDBMS 自动 完成 的 , 它 与 用 户 书写 的 查询 
语 名 无关。 系统 自动 生成 的 若干 候选 查询 计划 并 从 中 选取 * 好 的 ?查询 计划 的 程序 称 为 查询 
优化 器 。 查 询 优化 器 是 关系 数据 库 的 巨大 优势 所 在 , 它 使 用 户 不 必 考 虑 如 何 较 好 地 表达 查 
询 以 获得 较 高 的 效率 ,而 且 系 统 自 动 优化 存 取 路 径 可 以 比 用 户 的 程序 做 得 更 好 。 

查询 优化 有 多 种 方法 。@ 代 数 优化 : 指 关 系 代数 表达 式 的 优化 , 即 根据 某 些 启发 式 规 
则 ,改变 代数 表达 式 中 的 次 序 和 组 合 ,使 查询 执行 得 更 高 效 ,例如 * 先 选择 投影 和 后 连接 ”等 
就 可 完成 优化 ,所 以 也 成 为 规则 优化 ; 加 物理 优化 : 存 取 路 径 和 底层 操作 算法 的 选择 ,可 以 
是 基于 规则 的 、 基 于 代价 的 ,也 可 以 是 基于 语义 的 。 

实际 优化 过 程 中 为 了 达到 更 好 的 优化 效果 往往 都 综合 使 用 这 些 优化 技术 。 


5.2.4 查询 执行 
针对 查询 优化 器 得 到 的 查询 计划 ,系统 的 代码 生成 器 产生 出 这 个 计划 的 执行 代码 。 
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5.3.1 代数 优化 


前 面 已 经 介绍 过 ,查询 语句 经 过 查询 分 析 ,查询 检查 后 变 为 查询 树 , 它 是 代数 表达 式 的 
内 部 表示 形式 。 代 数 优化 主要 是 依据 关系 代数 表达 式 的 等 价 变换 规则 所 做 的 优化 。 

代数 优化 策略 是 通过 对 代数 关系 表达 式 的 等 价 变换 来 提高 效率 的 。 关 系 代数 表达 式 的 
等 价 是 指 两 个 关系 代数 表达 式 用 同一 个 关系 代入 之 后 得 到 的 结果 相同 , 即 两 个 相应 的 关系 
具有 相同 的 属性 结合 和 相同 的 元 组 集合 。 

1. 关系 代数 表达 式 变换 规则 

常用 的 代数 表达 式 的 等 价 变换 规则 主要 有 以 下 几 类 ,证明 从 略 。 

(1) 连接 、 笛 卡 儿 积 的 交换 律 

设 E 和 已 是 关系 代数 表达 式 , 下 是 连接 运算 条 件 , 则 下 列 等 价 公 式 成 立 : 

。 篆 卡 儿 积 的 交换 律 


E XE,= E,xE, 
。 自然 连接 的 交换 律 
Ei ME, = E, ME, 
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SN 
。 条件 连 接 的 交换 律 


(2) 连接 、 笛 卡 儿 积 的 结合 和 
设 已 、E, 和 是 关系 代数 表达 式 ,F 和 Fs 是 连接 运算 条 件 , 则 下 列 等 价 公式 成 立 : 
。 第 卡 儿 积 的 结合 律 
(E X E;:) Xx Es = E: X (E; XE,) 
。 自然 连接 的 结合 律 
(ED E;,) mE; = 已 [KGCE: [FE3:) 
。 条 件 连接 的 结合 和 
(Ei MIE.) hE, = E BCE: pAE,) 
(3) 选择 ,投影 的 串 接 定律 
@ 选择 运算 串 接 定 律 
设 已 是 一 个 关系 代数 表达 式 ,P 和 F。 是 选择 运算 条 件 , 则 下 列 等 价 公式 成 立 : 
。 选择 运算 顺序 可 交换 定律 
oF, (oF, (E)) = or, (or, (E)) 
。 合 取 条 件 分 解 定律 
OP (OF, (E)) = OF AFI (E) 
@ 投影 运算 串 接 定 律 
设 巨 是 关系 代数 表达 式 ,Ai(i 二 1,2,…,n) ,Bj;(j 二 1,2,…,m) 是 EE 中 的 某 些 属性 名 , 且 
{A1,As，…,A,}) 是 {Bi,B,,…,B,) 的 子 集 , 则 下 列 等 价 公式 成 立 : 
TAI Ags A, (TB Bs sB, (E)) = A, hh, (E) 
(4) 选择 与 笛 卡 儿 积 、 选 择 与 投影 的 交换 律 
。 选择 与 笛 卡 儿 积 的 交换 律 
设 已 .Es 是 关系 代数 表达 式 , 如 果 下 中 涉及 的 属性 都 是 Ei 中 的 属性 , 则 下 列 等 价 公 式 
成 立 : 
or(E! X E,) = or(E) XE, 
如 果 下 三 Fi 入 F,, 并 且 Fi 只 涉及 FE, 中 的 属性 ,Fs 只 涉及 E, 中 的 属性 , 则 有 上 述 规 
则 可 推出 : 
oF(E! X E;) = on (E1) X or (E;) 
车 所 只 涉及 EE 中 的 属性 ,F; 涉及 FE 和 已: 两 者 的 属性 , 则 有 : 
oF(E: X E:) = or (on (E1) X E;,) 
这 样 可 以 使 部 分 选择 运算 在 笛 卡 儿 积 前 先 做 。 
。 选择 与 投影 的 交换 律 
设 记 是 关系 代数 表达 式 ,Ai(i 二 1,2,…,n)、B;(j 二 1,2,…,m) 是 EE 的 属性 ,Ai 与 B; 不 
相交 ,F 是 选择 条 件 。 如 果 下 只 涉及 {Al， A:,…, A,}), 则 下 列 等 价 公 式 成 立 : 
OP (AAshsrih, (E)) SA hrsh, (GF(E)) 
如 果 下 中 有 不 属于 { Al，A,,…，A,) 的 属性 {B,，B,,…，B,) , 则 有 更 一 般 的 规则 : 


Th (or(E)) = TA A 1 A, (oF (na he A BB B, (ED))Y 
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(5) 选择 与 并 运算 .选择 与 差 运 算 .选择 与 自然 连接 的 分 配 率 

。 选择 与 并 运算 的 分 配 率 

设 El 和 Es 是 两 个 关系 代数 表达 式 ,并且 El 和 Es 具有 相同 的 属性 名 ,下 是 选择 条 件 ， 
则 下 列 等 式 成 立 : 
a UE 

。 选择 与 差 运 算 的 分 配 率 

设 El 和 Es 是 两 个 关系 代数 表达 式 , 并 且 FE, 和 Es 具有 相同 的 属性 名 ,下 是 选择 条 件 ， 
则 下 列 等 式 成 立 : 
or (El— E,) = or(E)— or(E,) 

。 选择 与 自然 连接 的 分 配 率 

设 El 和 Es 是 两 个 关系 代数 表达 式 , 并 且 El 和 Es 具有 相同 的 属性 名 ,下 是 选择 条 件 ， 
下 只 涉及 Fi 与 Es 的 公共 属性 , 则 下 列 等 式 成 立 : 

oF (E! DAE,) = or (Fi) Dor(E,) 

(6) 投影 与 笛 卡 儿 积 ,投影 与 并 的 分 配 率 

。 投影 与 笛 卡 儿 积 的 分 配 率 

设 El 和 E, 是 两 个 关系 代数 表达 式 ,A;(i 二 1,2,…,n) 是 Ei 的 属性 ,Bj;(j==1,2,…,m) 
是 E; 的 属性 , 则 下 列 等 价 公 式 成 立 : 

TA ,AiA BisBasesB, (El X Es) 3 ra Ass, (El) X rp,B,.,B, CE2) 

。 投影 与 并 的 分 配 率 

设 El 和 EE, 是 两 个 关系 代数 表达 式 ,Ai(i 二 1,2,…,n) 是 Ei、E, 的 公共 属性 , 则 下 列 等 
价 公式 成 立 : 


Md UN i CE ra 
2. 查询 树 的 启发 式 规则 


本 节 讨论 的 是 应 用 启发 式 规则 的 代数 优化 。 通 过 启发 式 规则 对 关系 表达 式 的 查询 树 表 
达 形 式 进行 优化 。 典 型 的 启发 式 规则 如 下 。 

(1) 选择 操作 优先 原则 

及 早 进行 选择 操作 ,这 是 查询 优化 中 的 最 重要 最 基本 的 一 条 。 尽 可 能 地 先 做 选择 操作 ， 
常常 会 将 查询 执行 时 间 降 低 好 几 个 数量 级 ,因为 选择 操作 会 使 计算 的 中 间 结 果 大 大 变 小 。 

(2) 投影 操作 优先 原则 

及 早 进行 扫描 操作 ,可 以 与 相关 的 元 素 按 合并 进行 。 例 如 可 以 把 若干 针对 同一 个 关系 
操作 的 投影 与 选择 运算 合并 进行 ,这 样 可 以 避免 重复 扫描 关系 , 在 笛 卡 儿 积 或 连接 操作 之 
前 尽量 排除 无 关 数 据 。 

(3) 第 卡 儿 积 合并 规则 

尽量 避免 单独 进行 笛 卡 儿 积 操作 ,可 以 把 笛 卡 儿 积 与 之 前 和 之 后 的 一 系列 选择 和 投影 
运算 合并 起 来 一 起 操作 ,这 样 可 以 避免 两 次 操作 之 间 的 磁盘 存 取 , 特 别 是 笛 卡 儿 乘 积 大量 的 
中 间 数 据 。 

(4) 提取 公共 表达 式 规则 

如 果 重 复出 现 的 子 表达 式 不 是 很 大 的 关系 ,并且 存 磁盘 中 读 取 这 个 关系 比 计算 这 个 表 
达 式 的 时 间 要 少 得 多 , 则 应 先 计 算 一 次 此 表达 式 , 把 中 间 结 果 存 储 起 来 .下 次 使 用 时 直接 读 
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取 这 个 结果 ,这 样 可 以 减少 计算 ,提高 效率 。 

下 面 给 出 遵循 这 些 启 发 式 规则 ,应 用 等 价 变换 公式 来 优化 关系 表达 式 的 算法 。 

算法 : 关系 表达 式 的 优化 。 

输入 : 一 个 关系 表达 式 的 查询 树 。 

输出 : 优化 的 查询 树 。 

方法 : 

@ 利用 等 价 变换 规则 把 形 如 cr nF,n…nF,(E) 变 换 为 op (ap (… (oF,(E))…))。 

@ 对 每 一 个 选择 ,利用 等 价 变化 规则 ,尽量 把 它 移 到 树 的 叶 端 。 

@ 对 每 一 个 投影 利用 等 价 变换 规则 , 尽 可 能 把 它 移 向 树 的 叶 端 。 

@ 利用 等 价 变换 规则 ,把 选择 和 投影 的 串 接合 并 成 单个 选择 、 单 个 投影 或 一 个 选择 后 
跟 一 个 投影 。 使 多 个 选择 或 投影 能 同时 执行 ,或 在 一 次 扫描 中 全 部 完成 ,尽管 这 种 变换 似乎 
违背 了 “投影 尽 可 能 早 做 "的 原则 ,但 这 样 做 效率 更 高 。 

@ 把 上 述 得 到 的 语法 树 的 内 结 点 分 组 。 每 一 双 目 运算 (X ,D4,U ,一 ) 和 它 所 有 的 直接 
祖先 为 一 组 ,这 些 直接 祖先 是 (c,x 运算 )。 如 果 其 后 代 直 到 叶子 全 是 单 目 运算 , 则 也 将 它们 
并 入 该 组 ,但 当 双 目 运 算是 笛 卡 儿 积 (X), 而 且 后 面 不 是 与 它 组 成 等 值 连接 的 选择 时 , 则 不 
能 把 选择 与 这 个 双 目 运算 组 成 同一 组 ,应 当 把 这 些 单 目 运算 单独 分 为 一 组 。 

【 例 5.2】 下 面 给 出 了 一 个 SQL 语句 的 代数 优化 示例 。 

求 选修 了 02 号 课程 的 学 生 姓名 。 用 SQL 表达 : 


SELECT S. Sname FROM S, SC WHERE S. Sno = SC. Sno AND SC.Cno= '02'; 


(1) 把 SQL 语句 转换 成 查询 树 ,如 图 5-2 所 示 。 

为 了 使 用 关系 代数 表达 式 的 优化 法 ,不 妨 假设 内 部 表示 是 关系 代数 语法 树 , 则 上 面 的 查 
询 树 如 图 5-3 所 示 。 

(2) 对 查询 树 进行 优化 。 

利用 转换 规则 把 选择 osc.cw-: 移 到 叶 端 ,图 5-3 所 示 的 查询 树 便 转换 成 图 5-4 所 示 的 优 


化 的 查询 树 。 
结果 和 让 
project(Sname) Gsccno-o2' Gs sno=SC Sno 
SELECT(SC.Cno="02') Gssno=SC sno x 


Join(S.Sno=SC.Sno) | Fa hy 2 
p> ss 和 2 | 


0 SC 
图 5-2 查询 树 图 5-3 关系 代数 语法 树 图 5-4 优化 后 的 查询 树 
5.3.2 物理 优化 


代数 优化 改变 了 查询 语句 中 操作 的 次 序 和 组 合 方式 ,但 不 涉及 底层 存 取 路 径 。 而 物理 优化 
主要 是 选择 合理 高 效 的 操作 算法 或 存 取 路 径 , 得 到 优化 的 查询 计划 ,来 达到 查询 优化 的 目的 。 
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选择 的 方式 可 以 是 : 

。 基于 启发 式 规则 的 优化 

启发 式 规则 是 指 那些 在 大 多 数 情况 下 都 适用 ,但 并 不 是 在 每 种 情况 下 都 适用 的 
规则 。 

基于 代价 估计 的 优化 

由 优化 器 估算 每 种 不 同 执行 策略 的 代价 ,并 选 出 具有 最 小 代价 的 执行 计划 。 

两 者 相 结合 的 优化 方法 

查询 优化 器 常会 把 这 两 种 技术 结合 在 一 起 使 用 。 因 为 能 执行 的 策略 有 很 多 ,要 穷尽 所 
有 的 查询 策略 进行 代价 估算 往往 是 不 可 行 的 ,会 使 查询 优化 本 身 付 出 的 代价 大 于 获得 
的 益处 。 为 此 常常 先 使 用 启发 式 规则 ,选取 若干 较 优 的 候选 方案 以 减少 代价 评估 的 工 
作 量 ; 然后 分 别 计算 各 方案 的 执行 代价 ,从 中 较 快 地 选择 出 最 终 的 优化 方案 。 


1. 基于 启发 式 规则 的 存 取 路 径 选 择优 化 


(1) 选择 操作 的 启发 式 规则 
@ 对 于 小 关系 ,使 用 全 表 扫 描 , 即 使 列 上 有 索引 。 
@ 对 于 大 关系 : 
。 对 于 选择 条 件 是 “ 主 码 一 值 "的 查询 ,查询 结果 最 多 是 一 个 元 组 ,可 以 选择 主 码 索引 。 
一 般 的 RDBMS 会 自动 创建 主 码 索引 。 
。 对 于 选择 条 件 是 “ 非 主 属性 二 值 " 的 查询 ,并 且 选 择 列 上 有 索引 , 则 要 估算 查询 结果 
元 组 的 数目 ,如 果 比 例 较 小 (二 10%) 可 以 使 用 索引 扫描 方法 ,否则 应 该 使 用 全 表 
扫描 。 

。 对 于 选择 条 件 是 属性 上 的 非 等 值 查询 或 者 范围 查询 时 ,并 且 选 择 列 上 有 索引 ,同样 
也 需要 估算 查询 结果 的 元 组 数目 ,如 果 比 例 较 小 (二 10%) 则 可 以 使 用 索引 扫描 方 
法 ,否则 还 是 应 该 使 用 全 表 扫 描 。 
。 对 于 用 AND 连接 的 合 取 选择 条 件 , 如 果 涉 及 这 些 属性 的 组 合 索 引 , 则 优先 采用 组 合 
索引 扫描 方法 。 

。 对 于 用 OR 连接 的 析 取 选择 条 件 ,一 般 使 用 全 表 顺 序 扫描 。 

(2) 连接 操作 的 启发 式 规则 

@ 如 果 两 个 表 都 已 经 按照 连接 属性 排序 , 则 选用 排序 -合并 方法 。 

@ 如 果 一 个 表 在 连接 属性 上 有 索引 , 则 可 以 选用 索引 连接 方法 。 

@ 如 果 上 面 两 条 规则 都 不 适用 ,其 中 一 个 表 较 小 , 则 可 选用 Hash join 方法 。 

@ 最 后 可 以 选用 嵌 套 循环 方法 ,并 选用 其 中 较 小 的 表 ( 确 切 地 说 是 占用 的 块 数 较 少 的 
表 ) 作 为 外 层 循环 的 表 。 

上 面 仅 仅 列 出 了 一 些 主 要 的 启发 式 规则 ,在 适应 的 RDBMS 中 启发 式 规则 要 多 得 多 。 


2. 基于 代价 估计 的 优化 


启发 式 优化 规则 是 定性 选择 ,比较 粗糙 ,但 是 实现 简单 而 且 优 化 本 身 代价 较 小 ,适合 于 
解释 执行 系统 。 因 为 解释 执行 的 系统 ,优化 开销 包含 在 查询 总 开销 之 中 。 而 在 编译 执行 的 
系统 中 ,一 次 编译 优化 多 次 执行 ,查询 优化 和 查询 执行 是 分 开 的 ,因此 ,可 以 采用 更 精细 更 复 
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杂 的 机 遇 代价 的 优化 方法 。 

(1) 信息 统计 

基于 代价 的 优化 方法 就 是 要 计算 各 种 操作 算法 的 执行 代价 ,而 代价 的 计算 算法 与 数据 
库 的 状态 密切 相关 。 为 此 在 数据 字典 中 存储 了 优化 器 需要 的 统计 信息 (database 
statistics) ,这 些 信息 主要 有 : 

Q@ 基本 表 

对 每 个 基本 表 , 包 含 该 表 的 元 组 总 数 (N) ,元 组 长 度 (1) 、 占 用 的 块 数 (B)、 占 用 的 溢出 块 
数 (BO) 等 信息 。 

@ 基本 表 的 列 

对 基 表 的 每 个 列 ,包含 该 列 不 同 值 的 个 数 (m) ,选择 率 (/) ,该 列 最 大 值 ,最 小 值 ,该 列 上 
是 否 已 经 建立 了 索引 ,及 索引 的 种 类 。 

@ 索引 

对 索引 ,例如 B 十 树 索 引 ,该 索引 的 层 数 ( 工 ) 不 同 索 引 值 的 个 数 .索引 的 选择 基数 SC 有 
S 个 元 组 具有 某 个 索引 值 ) .索引 的 叶 结 点 数 (Y) 。 

除了 上 面 的 这 些 信息 ,还 有 一 些 必要 的 其 他 信息 。 

(2) 估算 代价 

在 上 面 这 些 信息 的 基础 上 查询 优化 器 可 以 采取 一 些 算法 来 估计 执行 查询 的 代价 。 下 面 
给 出 一 些 常 用 的 操作 算法 的 执行 代价 估算 方法 。 

Q@ 全 表 扫 描 算法 代价 的 估算 
如 果 基 本 表 大 小 为 B 块 , 则 全 表 扫 描 算 法 的 代价 cost=B; 
如 果 选 择 条 件 是 “ 码 王 值 ”那么 平均 搜索 代价 cost 二 B/2。 
@ 索引 扫描 算法 代价 的 估算 
如 果 选 择 条 件 是 “ 码 三 值 ”, 则 采用 该 表 的 主 索 引 , 若 为 B 十 树 , 层 数 为 了 ,需要 存 取 B 十 
树 中 从 根 结 点 到 叶 结 点 工 块 ,再 加 上 基本 表 中 该 元 组 所 在 的 那 一 块 ,所 以 cost 二 LL 十 1。 
如 果 选 择 条 件 涉及 非 码 属性 ,车 为 B 十 树 索引 ,选择 条 件 是 相等 比较 ,S 是 索引 的 选择 
基数 (有 S 个 元 组 满足 条 件 )。 因 为 满足 条 件 的 元 组 可 能 会 保存 在 不 同 的 块 上 ,所 以 (最 坏 
的 情况 )cost=L 十 S。 
如 果 比 较 条 件 是 非 等 值 操作 ,假设 有 一 半 的 元 组 满足 条 件 , 那 么 就 要 存 取 一 半 的 叶 结 
点 ,并 通过 索引 访问 一 半 的 表 存 储 块 。 所 以 cost==L 十 Y/2 十 B/2。 如 果 可 以 获得 更 准确 的 
选择 基数 ,可 以 进一步 修正 Y/2 与 B/2。 

@ 幅 套 循环 连接 算法 代价 的 估算 

嵌 套 循环 连接 算法 的 代价 为 cost= Br 十 Br Bs/(K 一 1)。 如 果 需 要 把 连接 结果 写 回 磁 
盘 , 则 cost= Br 十 Br Bs/(K 一 1) 十 (Frs x Nr x Ns)/Mrs。 其 中 Frs 为 连接 选择 性 (join 
selectivity) ,表示 连接 结果 元 组 数 的 比例 ,Mrs 是 存放 连接 结果 的 块 因子 ,表示 每 块 中 可 以 
存放 的 结果 元 组 数目 。 

@ 排序 -合并 连接 算法 代价 的 估算 

如 果 连 接 表 已 经 按照 连接 属性 排 好 序 , 则 cost= Br 十 Bs 十 (Frs x Nrx Ns)/Mrs。 

如 果 必 须 对 文件 排序 ,那么 还 需要 在 代价 函数 中 加 上 排序 的 代价 。 对 于 包含 B 个 块 的 
文件 排序 的 代价 大 约 是 (2X B) 十 (2X BX log,B)。 
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上 面 仅仅 列 出 了 少数 操作 算法 的 代价 估算 示例 。 在 实际 的 RDBMS 中 代价 估算 公式 要 
多 得 多 ,也 复杂 得 多 。 


64 实际 应 用 中 的 查询 优化 


本 小 节 将 从 实际 应 用 层面 讨论 在 使 用 数据 库 时 可 以 采取 哪些 策略 来 提高 查询 优化 的 
效率 。 


5.4.1 基于 索引 的 优化 


一 般 来 说 ,建立 和 删除 索引 的 工作 都 是 由 数据 库 管 理 员 DBA 或 表 的 主人 (owner) 即 建 
立 表 的 主人 负责 完成 的 。 系 统 在 存 取 数 据 时 会 自动 选择 合适 的 索引 作为 存 取 路 径 ,用 户 不 
必 显 式 地 选择 索引 。 

使 用 索引 的 一 个 主要 目的 是 避免 全 表 扫 描 , 减 少 磁盘 1/O, 加 快 数据 库 查询 的 速度 。 但 
是 ,索引 的 建立 降低 了 数据 更 新 的 速度 ,因为 数据 不 仅 要 增加 到 表 中 ,而 且 还 要 增加 到 索引 
中 。 另 外 ,索引 还 需要 额外 的 磁盘 空间 和 维护 开销 。 所 以 在 设计 和 使 用 索引 时 应 仔细 考虑 
实际 应 用 中 修改 和 查询 的 频率 ,权衡 建立 索引 的 利弊 ,并 应 遵循 以 下 原则 ， 

(1) 值得 建 索引 并 且 用 得 上 。 记 录 有 一 定 规模 ,而 且 查询 只 限于 少数 记录 ,规模 小 的 表 
不 宜 建立 索引 。 索 引 在 WHERE 子 句 中 应 频繁 使 用 ,索引 并 不 是 越 多 越 好 , 当 对 表 执 行 更 
新 操作 时 系统 会 自动 更 新 该 表 的 所 有 索引 文件 ,更 新 索引 文件 是 要 耗费 时 间 的 ,因此 也 就 降 
低 了 系统 的 效率 。 

(2) 先 装 数据 ,后 建 索引 。 对 于 大 多 数 基 本 表 , 总 是 有 一 批 初始 数据 需要 装 入 。 建 立 关 
系 后 , 先 将 这 些 初始 数据 装 入 基本 表 , 然 后 再 建立 索引 ,这 样 可 以 加 快 初始 数据 的 录入 速度 。 

(3) 查询 语句 中 经 常 进 行 排序 或 在 分 组 (用 GROUP BY 或 ORDER BY 操作 ) 的 列 上 
建立 索引 。 如 果 待 排序 的 列 有 多 个 ,可 以 在 这 些 列 上 建立 复合 索引 。 但 应 注意 在 建立 复合 
索引 时 涉及 的 属性 列 不 要 太 多 ,和 否则 会 增加 索引 的 开销 。 当 执行 更 新 操作 时 会 降低 数据 库 
的 更 新 速度 。 组 合 索引 前 导 列 在 查询 条 件 中 必须 使 用 ,否则 该 组 合 索引 失效 。 如 果 SQL 中 
能 形成 索引 覆盖 ,性 能 将 达到 最 优 。 

(4) 需要 返回 某 字 段 局 部 范围 的 大 量 数据 ,应 在 该 字段 建立 聚 位 索引。 经常 修 改 的 列 
EGR 在 经 常 进行 连接 ,但 没有 指定 为 外 键 的 
列 上 建立 索引 ,而 不 经 常 连接 的 字段 则 由 优化 器 自动 生成 索引 。 

(5) Ei ne 上 建立 索引 ,避免 在 重复 值 较 多 的 列 


行 。 如 果 一 个 个 语句 查找 的 行 数 超过 总 行 数 的 20%, 它 将 不 能 通过 使 用 索引 获得 性 能 上 的 
提升 。 

一 般 来 说 , 当 检 索 的 数据 超过 20% 时 ,数据 库 将 选择 全 表 扫 描 , 而 不 使 用 索引 。 也 就 是 
说 , 表 很 小 或 者 查询 将 检索 表 的 大 部 分 时 ,检索 并 不 能 提高 性 能 。 最 好 的 情况 是 ,将 一 些 列 
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包含 在 索引 中 ,而 查询 恰好 包含 由 索引 维护 的 那些 行 ,此 时 优化 器 将 从 索引 直接 提供 结果 
集 ,而 不 用 回 到 表 中 去 取 数 据 。 

(7) 如 果 建 表 时 就 建立 索引 ,那么 在 输入 初始 数据 时 ,每 插入 一 条 记录 都 要 维护 一 次 
索引 。 系 统 在 使 用 一 段 时 间 后 ,索引 可 能 会 失效 或 者 因为 频繁 操作 而 使 得 读 取 效 率 降 
低 , 当 系统 效率 降低 或 使 用 索引 不 明 不 白地 慢 下 来 的 时 候 , 可 以 使 用 工具 检查 索引 的 完 
整 性 ,必要 时 进行 修复 。 另 外 , 当 数 据 库 表 更 新 大 量 数据 后 ,删除 并 重建 索引 可 以 提高 查 
询 速 度 。 

(8) 如 果 表 中 对 主键 查询 较 少 ,并 且 很 少 按照 范围 检索 ,就 不 要 将 聚集 索引 建立 在 主键 
上 。 由 于 聚集 索引 每 张 表 只 有 一 个 ,因此 应 该 根据 实际 情况 确定 将 其 分 配给 经 常 使 用 范围 
检查 的 属性 列 ,这样 可 以 最 大 限度 地 提高 系统 的 运行 效率 。 

(9) 比较 窗 的 索引 具有 较 高 的 效率 。 对 于 比较 窄 的 索引 来 说 ,每 页 上 能 存放 较 多 的 索 
引 行 ,而 且 索 引 的 深度 也 比较 少 ,所 以 ,缓存 中 能 放置 更 多 的 索引 页 ,这 样 也 减少 了 IO 
操作 。 

(10) 不 应 该 对 包含 大 量 NULL 值 的 字段 设置 索引 。 就 像 代码 和 数据 库 结 构 在 投入 使 
用 之 前 需要 反复 进行 测试 一 样 , 索 引 也 是 如 此 。 应 该 用 一 些 时 间 来 尝试 不 同 的 索引 组 合 。 
索引 的 使 用 没有 什么 固定 的 规则 ,需要 对 表 的 关系 、 查 询 和 事务 需求 .数据 本 身 有 透彻 的 了 
解 才 能 最 有 效 地 使 用 索引 。 索 引 也 不 是 越 多 越 好 ,只 有 适度 参照 上 面 的 原则 使 用 索引 才能 
取得 较 好 的 效果 。 

注意 : 表 和 索引 都 应 该 进行 事先 的 规划 ,不 要 认为 使 用 索引 就 能 解决 所 有 的 性 能 问题 ， 
索引 有 可 能 根本 不 会 改善 性 能 (其 至 可 能 降低 性 能 ) 而 只 是 占据 磁盘 空间 。 

在 使 用 索引 时 可 以 有 效 地 提高 查询 速度 ,但 如 果 SQL 语句 使 用 得 不 恰当 的 话 , 所 建立 
的 索引 就 不 能 发 挥 作用 。 所 以 应 该 做 到 不 但 会 写 SQL 语句 ,还 要 写 出 性 能 优良 的 SQL 
语句 。 


5.4.2 查询 语句 的 优化 


下 面 介绍 的 一 些 针 对 SQL 语句 的 优化 方法 ,虽然 查询 优化 器 已 经 帮 用 户 做 了 很 多 优 
化 ,但 是 熟识 这 些 方法 可 以 在 实际 使 用 中 提高 查询 效率 。 


1. 避免 和 简化 排序 


简化 或 避免 对 大 型 表 进行 重复 的 排序 ,会 极 大 地 提高 SQL 语句 的 执行 效率 。 当 能 够 利 
用 索引 自动 以 适当 的 次 序 产 生 输 出 时 ,优化 器 就 避免 了 排序 的 步骤。 
为 了 避免 不 必要 的 排序 ,必须 正确 地 建立 索引 ; 如 果 排 序 不 可 避免 , 则 应 当 简化 它 , 如 
缩小 排序 列 的 范围 等 。 在 嵌 套 查询 中 ,对 表 进行 顺序 存 取 对 查询 的 效率 可 能 产生 致命 的 影 
响 。 如 果 采 用 顺序 存 取 策 略 ,一 个 嵌 套 3 层 的 查询 ,如 果 每 层 都 查询 1000 行 ,那么 该 查询 就 
要 查询 1 亿 行 数据 ,避免 这 种 情况 的 主要 方法 就 是 对 连接 的 列 进行 索引 或 使 用 并 集 来 避免 
顺序 存 取 。 

【 例 5.3】 OR 不 能 使 用 索引 ,可 以 用 UNION 来 代替 ,以 避免 全 表 扫描 。 


SELECT Sno, Grade FROM SC 
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WHERE (Sno = '2007111001' and Grade > = 60) or Grade > = 80 
调整 为 一 > 
SELECT Sno，Grade FROM SC WHERE Sno = '2007111001' and Grade > = 60 
UNION 
SELECT Sno，Grade FROM SC WHERE Grade > = 80 


2. 消除 对 大 型 表 行 数据 的 顺序 存储 (避免 顺序 存 取 ) 


在 嵌 套 查询 中 , 表 的 顺序 存 取 对 查询 效率 可 能 会 产生 致命 的 影响 ,比如 一 个 嵌 套 3 层 的 查 
询 采 用 顺序 存 取 策略 ,如 果 要 每 层 都 查询 1000 行 ,那么 这 个 赔 套 查询 就 要 查询 10 亿 行 数据 。 
避免 这 种 情况 的 主要 方法 就 是 对 连接 列 进行 索引 ,还 可 以 使 用 并 集 (UNION) 来 避免 顺序 存 取 。 
尽管 在 所 有 的 检查 列 上 都 有 索引 ,但 某 些 形 式 的 WHERE 子 句 强迫 优化 器 使 用 顺序 存 取 。 


3. 避免 相关 子 查询 

相关 查询 效率 不 高 ,如 果 在 主 查 询 和 WHERE 子 句 中 的 查询 中 出 现 了 同一 个 列 标签 ， 
就 会 使 主 查询 的 列 值 改 变 后 , 子 查询 也 必须 重新 进行 一 次 查询 。 查 询 的 嵌 套 层次 越 多 ,查询 
的 效率 就 会 越 低 ,所 以 应 该 避免 子 查询 。 如 果子 查询 不 可 避免 ,那么 就 要 在 查询 的 过 程 中 过 
滤 掉 尽 可 能 多 的 行 。 

4. 避免 困难 的 正规 表达 式 

MATCHS 和 LIKE 关键 字 支 持 通配符 匹配 ,技术 上 叫做 正规 表达 式 , 但 这 种 匹配 较为 
消耗 时 间 ,另外 还 要 避免 使 用 非 开始 的 子 串 ,如 

SELECT * FROM employee WHERE name LIKE '% zhang' 
写 为 

SELECT *# FROM employee WHERE name LIKE 'z%' 
更 有 效 。 

5. 使 用 临时 表 加 速 查询 


对 表 的 一 个 子 集 进 行 排序 并 创建 临时 表 , 也 能 实现 查询 加 速 。 在 一 些 情况 下 ,这样 做 有 
助 于 避免 多 重 排序 操作 ,而 且 在 其 他 方面 还 能 简化 优化 器 的 工作 。 
【 例 5. 4】 创建 临时 表 加 速 查询 。 


SELECT S. Sno，Sname，SC. Cno，Grade FROM S，SC 
WHERE S. Sno = SC.Sno AND SC.Grade >= 90 ORDER BY Same 
INTO TEMP S_SC 


用 如 下 方式 在 临时 表 中 进行 查询 : 
SELECT x* FROM S_SC WHERE Sname = ' 张 三 ' 


所 创建 的 临时 表 的 行 要 比 主 表 的 行 少 ,其 物理 顺序 就 是 所 要 求 的 顺序 ,这 样 就 减少 了 磁 
盘 I/O, 降 低 了 查询 的 工作 量 ,提高 了 效率 ,而 且 临 时 表 的 创建 并 不 会 反映 主 表 的 修改 。 
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6. 用 排序 来 取代 非 顺序 存储 

磁盘 存 取 臂 的 来 回 移动 使 得 非 顺 序 磁盘 存 取 变 成 了 最 慢 的 操作 。 但 是 在 SQL 语句 中 
这 个 情况 被 隐藏 了 ,这 样 就 使 得 我 们 在 写 应 用 程序 时 很 容易 写 出 进行 了 大 量 的 非 顺序 页 的 
查询 代码 ,降低 了 查询 速度 ,对 于 这 个 现象 还 没有 很 好 的 解决 方法 ,只 能 依赖 于 数据 库 的 排 
序 能 力 来 蔡 代 非 顺序 存 取 。 


7. 避免 大 规模 排序 操作 


大 规模 排序 操作 意味 着 使 用 ORDER BY .GROUPE BY 和 HAVING 子 句 。 无 论 何 时 
执行 排序 操作 ,都 意味 着 数据 自己 必须 保存 到 内 存 或 磁盘 里 ( 当 以 分 配 的 内 存 空 间 不 足 时 )。 
数据 是 经 常 需要 排序 的 ,排序 的 主要 问题 是 会 影响 SQL 语句 的 响应 时 间 。 由 于 大 规模 排序 
操作 不 是 总 能 够 避免 的 ,所 以 最 好 把 大 规模 排序 在 批 处 理 过 程 里 ,在 数据 库 使 用 的 非 繁忙 期 
运行 ,从 而 避免 影响 大 多 数 用 户 进程 的 性 能 。 


8. 避免 使 用 IN 语句 


当 查 询 条 件 中 有 IN 关键 字 时 ,优化 器 采用 OR 并 列 条 件 。 数 据 库 管理 系统 将 对 每 一 个 
OR 从 句 进行 查询 ,将 所 有 的 结果 合并 后 去 掉 重 复 项 作为 最 终结 果 , 当 可 以 使 用 IN 或 
EXIST 语句 时 应 考虑 如 下 原则 : EXIST 远 比 IN 的 效率 高 ,在 操作 中 如 果 把 所 有 的 IN 操作 
符 子 查询 改写 为 使 用 EXIST 的 子 查 询 , 这 样 效率 更 高 。 同 理 ,使 用 NOT EXIST 代替 NOT 
IN 会 使 查询 添加 限制 条 件 , 由 此 减少 全 表 扫 描 的 次 数 , 从 而 加 快 查询 的 速度 以 达到 提高 数 
据 库 运行 效率 的 目的 。 

9. 使 用 WHERE 代替 HAVING 

HAVING 子 句 仅 在 聚集 GROUP BY 子 句 收集 行 之 后 才 施加 限制 ,这 样 会 导致 全 表 扫描 
后 再 选择 ,而 如 果 可 以 使 用 WHERE 子 句 来 代替 HAVING , 则 在 扫描 表 的 同时 就 进行 了 选择 ， 


查询 效率 大 大 提高 了 。 但 当 HAVING 子 句 用 于 聚集 函数 ,不 能 有 WHERE 代替 时 则 必须 
使 用 HAVING 。 


10. 避免 使 用 不 兼容 的 数据 类 型 


float 和 int,char 和 varchar,binary 和 varbinary 是 不 兼容 的 数据 类 型 。 数 据 类 型 的 不 
兼容 会 使 优化 器 无 法 执行 一 些 本 来 可 以 进行 优化 的 操作 。 例 如 : 


SELECT * FROM SC WHERE Grade > 62.5 


在 这 条 语句 中 ,如 果 grade 字段 是 int 型 的 , 则 优化 器 很 难 对 其 进行 优化 ,因为 62. 5 是 
个 float 型 的 数据 。 应 该 在 编程 时 将 浮 点 型 转化 为 整 型 ,而 不 是 等 到 运行 时 再 转化 。 


6.5 本 章 小 结 


查询 处 理 是 数据 库 管理 的 核心 ,而 查询 优化 又 是 查询 处 理 的 关键 技术 。 查 询 优化 是 任 
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何 数据 库 系统 都 会 面临 的 问题 。 对 于 关系 数据 库 来 说 ,由 于 其 所 依据 的 理论 的 特点 ,查询 优 
化 问题 的 研究 与 解决 反倒 成 为 其 得 以 蓬勃 发 展 的 重要 机 遇 。 查 询 优化 一 般 可 分 为 代数 优化 
和 物理 优化 。 代 数 优化 是 指 关系 代数 表达 式 的 优化 ; 物理 优化 是 指 存储 路 径 和 底层 操作 算 
法 的 优化 。 本 章 在 介绍 了 查询 的 处 理 过 程 后 ,重点 讨论 了 查询 的 优化 方法 ,以 及 代数 优化 和 
物理 优化 ,最 后 指出 在 实际 使 用 数据 库 的 过 程 中 应 该 注意 能 提高 查询 优化 的 方法 ,合理 使 
索引 和 查询 语句 的 优化 。 


(6.6 习题 


5.6.1 简 答题 

试 述 关系 数据 库 查 询 处 理 的 过 程 。 
试 述 查询 优化 的 一 般 方法 。 

试 述 使 用 索引 的 一 般 准 则 。 

. 试 述 查 询 语句 优化 的 一 般 方法 。 
5.6.2 综合 题 


对 学 生 课 程 数 据 库 有 如 下 查询 : 

SELECT Cno FROM S,C, SC WHERE S$. Sno = SC. Sno AND SC. Cno = C.Cno AND S. Sdept = 'IS'; 

此 查询 要 求 给 出 信息 系 学 生 选 修了 的 所 有 课程 名 称 。 

试 画 出 用 关系 代数 表示 的 语法 树 , 并 用 关系 代数 表达 式 优化 算法 对 原始 的 语法 树 进行 
优化 处 理 , 画 出 优化 后 的 标准 语法 树 。 
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数据 库 系统 中 的 数据 由 DBMS 统一 控制 和 管理 ,从 而 保证 数据 库 中 数据 的 安全 可 靠 和 
正确 有 效 。 数 据 库 的 保护 主要 涉及 数据 的 安全 性 .完整 性 .并 发 控制 和 数据 库 恢 复 四 个 
方面 。 


@.1 数据 库 安全 性 


数据 库 的 安全 性 是 指 保护 数据 库 , 防 止 用 户 不 合法 使 用 所 造成 的 数据 泄露 、 修 改 或 
破坏 。 


6.1.1 数据 库 安全 性 概述 


数据 库 一 个 最 大 的 特点 就 是 数据 共享 ,但 数据 共享 必然 会 带 来 一 系列 的 数据 库 安全 性 
问题 。 数 据 库 中 存放 了 大 量 的 企业 ,组 织 或 者 个 人 的 数据 ,其 中 许多 数据 可 能 是 非常 关键 
的 ,机 密 的 或 者 涉及 个 人 隐私 ,如 国家 机 密 、 军 事 秘密 、 新 产品 实验 数据 市 场 营销 策略 .市场 
销售 计划 、 客 户 档案 \ 银 行 储蓄 数据 等 ,通常 要 求 只 允许 部 分 有 权限 的 人 才 可 以 访问 这 些 数 
据 。 如 果 DBMS 不 能 严格 地 保证 数据 库 中 数据 的 安全 性 ,就 会 严重 制约 数据 库 的 应 用 。 
因此 ,数据 库 系统 中 的 数据 共享 不 能 是 无 条 件 的 共享 ,而 必须 是 在 DBMS 统一 的 严格 
控制 和 管理 下 ,只 允许 有 合法 权限 的 用 户 访问 允许 他 存 取 的 数据 ,数据 库 管理 系统 通常 采用 
种 种 措施 防止 用 户 越权 使 用 数据 库 ,数据 库 系 统 的 安全 保护 措施 是 否 有 效 是 数据 库 系 统 主 
要 的 性 能 指标 之 一 。 

与 数据 安全 性 密切 相关 的 是 数据 的 保密 问题 , 即 合 法 用 户 合 法 地 访问 到 机 密 数 据 后 能 
否 对 这 些 数据 保密 ,这 在 很 大 程度 上 属于 法 律 、 政 策 伦理、 道德 方面 的 问题 ,而 不 属于 技术 
上 的 问题 , 故 在 本 书 中 不 予 讨论 。 事实 上 ,一 些 国家 已 经 成 立 了 专门 的 机 构 对 数据 保密 制定 
了 相应 的 法 律 道德 准则 和 政策 法 规 。 


6.1.2 数据 库 安全 性 策略 


实际 上 ,安全 性 问题 并 不 是 数据 库 系统 所 独 有 的 ,所 有 计算 机 系统 中 都 存在 这 个 问题 ， 
只 是 由 于 数据 库 系统 中 存放 了 大 量 数据 ,并 为 许多 用 户 直 接 共享 ,因此 使 得 其 安全 性 问题 更 
为 突出 。 在 一 般 的 计算 机 系统 中 ,安全 措施 往往 是 一 级 一 级 层 层 设置 的 。 图 6-1 所 示 为 一 
种 很 常用 的 安全 模型 。 
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应 用 =~| DBMS ==| 操作 系统 — 数据 库 | 


用 户 标识 存 取 控制 人 密码 存储 


图 6-1 计算 机 系统 的 安全 模型 


在 图 6-1 所 示 的 安全 模型 中 , 当 用 户 要 求 进入 计算 机 系统 时 ,系统 首先 根据 用 户 输入 的 
用 户 标 识 进 行 身份 鉴定 ,只 有 合法 的 用 户 才 人 允许 进入 计算 机 系统 ; 对 已 经 登录 的 用 户 ， 
DBMS 还 要 对 数据 的 存 取 权限 加 以 控制 ,只 允许 用 户 执行 合法 操作 ; 同时 ,操作 系统 也 会 有 
自己 的 保护 措施 ,防止 用 户 非法 获取 文件 ; 最 后 数据 还 可 以 以 密码 形式 存储 到 数据 库 中 。 
这 里 只 讨论 与 数据 库 有 关 的 用 户 标识 与 鉴定 、 存 取 控 制 、 视 图 .审计 以 及 数据 加 密 等 安全 
技术 。 

这 些 数据 保护 措施 都 是 由 计算 机 系统 设置 的 。 除 此 之 外 ,数据 保护 措施 还 包括 加 强 保 
安 工作 ,防止 通信 线路 窃听 ,防止 盗窃 物 理 存 储 设备 等 ,这 方面 的 内 容 也 不 在 本 章 讨 论 之 列 。 


1. 用 户 标识 与 鉴定 


DBMS 要 求 严格 的 用 户 身份 鉴定 。 一 个 DBMS 可 能 要 求 用 户 传递 指定 的 通行 字 和 时 
间 日 期 检查 ,这 一 认证 是 在 操作 系统 完成 的 认证 之 外 另 加 的 。DBMS 在 操作 系统 之 外 作为 
一 个 应 用 程序 被 运行 ,这 意味 着 它 没有 得 到 操作 系统 的 可 信赖 路 径 , 因 此 必须 怀疑 它 收 到 的 
任何 数据 ,包括 用 户 认证 。 因 此 DBMS 最 好 有 自己 的 认证 机 制 。 

用 户 标 识 和 鉴定 是 系统 提供 的 最 外 层 安 全 保护 措施 ,其 方法 是 由 系统 提供 一 定 的 方式 
证 用户 标识 自己 的 名 字 或 身份 。 系 统 内 部 记录 着 所 有 合法 用 户 的 标识 ,每 次 用 户 要 求 进 入 
系统 时 ,由 系统 将 用 户 提供 的 身份 标识 与 系统 内 部 记录 的 合法 用 户 标识 进行 核对 ,通过 鉴定 
后 才 提供 机 器 使 用 权 。 获 得 机 器 使 用 权 的 用 户 不 一 定 具 有 数据 库 的 使 用 权 ,数据 库 系 统 需 
要 进行 进一步 的 用 户 标 识 和 鉴定 ,以 拒绝 没有 数据 库 使 用 权 的 用 户 ( 非 法 用 户 ) 进 行 数据 库 
数据 的 存 取 操 作 。 

用 户 标 识 与 鉴定 的 方法 有 很 多 种 ,常用 的 有 以 下 三 种 。 

。 用 户 的 专门 知识 : 如 口令 ,密码 和 一 组 预定 的 问答 等 。 

。 用 户 的 特有 东西 : 如 徽章 、 磁 卡 、 钥 匙 等 。 

。 用 户 的 个 人 特征 : 如 声音 、 指 纹 、 签 名 等 。 

(1) 用 户 的 专门 知识 识别 

使 用 只 有 用 户 自己 知道 的 特征 知识 来 识别 用 户 是 最 常用 的 一 种 方法 ,一 般 采用 口令 或 
者 密码 ,有 时 使 用 只 有 用 户 自 己 能 给 出 正确 答案 的 一 组 问题 ,有 时 还 可 以 将 两 者 结合 起 来 
使 用 。 

使 用 这 类 方法 要 注意 : 

。 标识 的 有 效 性 。 口 令 .密码 或 者 问题 答案 要 尽 可 能 准确 地 标识 每 一 个 用 户 。 

。 内 容 的 简易 性 。 口 令 、 密 码 要 长 短 适中 ,问答 过 程 不 要 太 烦 琐 。 

。 本 身 的 安全 性 。 为 了 防止 口令 .密码 或 问题 答案 的 泄露 或 失窃 ,需要 经 常 更 改 。 

实现 这 种 方法 需要 使 用 专门 的 软件 来 进行 用 户 ID 及 其 口令 的 登记 、 维 护 和 检验 等 ,但 
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它 不 需要 额外 专门 的 硬件 设备 ,这 是 它 的 优点 。 其 主要 的 缺点 是 口令 密码 或 者 问题 答案 被 
泄密 (包括 无 意 或 故意 ) 给 别人 ,不 会 有 任何 痕迹 ,不 易 被 发 觉 , 所 以 存在 安全 隐患 。 
(2) 用 户 的 特有 东西 识别 
让 每 一 个 用 户 持 有 一 个 他 所 特有 的 物件 ,如 徽章 磁卡、 钥匙 等 。 识 别 时 ,将 其 插入 一 个 
“阅读 器 中, 读 取 其 面 上 的 磁 条 信息 。 该 方法 是 目前 一 些 安全 系统 中 比较 常用 的 一 种 方法 ， 
但 用 在 数据 库 系统 中 需要 考虑 以 下 两 点 : 
。 需要 专门 的 阅读 装置 。 
。 要求 从 阅读 器 中 抽取 信息 及 与 DBMS 接口 的 软件 。 
该 方法 的 优点 是 比 个 人 特征 识别 更 简单 有效 ,性价比 更 高 。 其 缺点 是 容易 忘记 带 微 
章 、 磁 卡 或 钥匙 等 ,也 有 可 能 丢失 甚至 被 人 资 取 。 有 时 在 无 这 种 特有 的 物件 情况 下 ,用户 为 
了 及 时 完成 他 的 任务 ,就 临时 采用 替代 的 办 法 ,而 这 本 身 又 会 危及 系统 安全 。 
(3) 用 户 的 个 人 特征 识别 
使 用 每 个 人 所 具有 的 个 人 特征 ,如 声音 .指纹 .签名 等 来 识别 用 户 ,是 当前 最 有 效 的 方 
法 。 但 是 有 两 个 问题 必须 解决 : 
。 专门 设备 。 要 能 准确 地 记录 存储 和 存 取 这 些 个 人 特征 。 
。 识别 算法 。 要 能 较 准确 地 识别 出 每 个 人 的 声音 、 指 纹 或 签名 。 这 里 的 关键 问题 是 
“有 效 性 测度 ”, 要 让 “合法 者 被 拒绝 ”和 “非法 者 被 接受 "的 误 判 率 达 到 实用 的 程度 ， 
或 者 达到 应 用 环境 可 接受 的 程度 。 百 分 之 百 正确 , 即 误 判 率 为 零 几乎 是 不 可 能 的 。 
另外 ,代价 也 是 不 得 不 考虑 的 问题 ,这 不 仅 是 经 济 上 的 代价 ,还 包括 识别 算法 执行 的 
时 空 代价 , 它 影响 着 整个 安全 子 系统 的 性 能 比 。 


2. 存 取 控制 


在 数据 库 中 ,为 了 保证 用 户 只 能 访问 他 有 权 存 取 的 数据 ,必须 预先 对 每 个 用 户 定义 存 取 
权限 。 对 于 通过 鉴定 进入 系统 的 用 户 ( 即 合法 用 户 ), 系 统 根据 他 的 存 取 权 限定 义 对 他 的 各 
种 操作 请 求 进行 控制 ,确保 他 只 执行 合法 操作 ,而 对 于 未 授权 的 用 户 ( 非 法 用 户 ) 则 无 法 接近 
数据 ,这 主要 由 数据 库 系统 的 存 取 控 制 机 制 来 完成 。 

(1) 存 取 控 制 机 制 的 构成 

存 取 控制 机 制 主要 包括 两 部 分 : 

@ 定义 用 户 权限 ,并 将 用 户 权 限 登 记 到 数据 字典 中 。 

用 户 权限 是 指 用 户 对 于 数据 对 象 能 够 执行 的 操作 种 类 。 要 进行 用 户 权 限定 义 ,系统 必 
须 提 供 有 关 定 义 用 户 权限 的 语言 ,该 语言 称 为 数据 控制 语言 DCL (Data Control 
Language); 具有 授权 资格 的 用 户 使 用 DCL 描述 授权 决定 ,并 将 授权 决定 告知 计算 机 ; 计 
算 机 分 析 授 权 决 定 ,并 将 编译 后 的 授权 决定 存放 在 数据 字典 中 。 

@ 当 用 户 提出 操作 请 求 时 ,系统 进行 权限 检查 ,拒绝 用 户 的 非法 操作 。 

每 当 用 户 发 出 存 取 数据 库 的 操作 请 求 后 ,DBMS 首先 查找 数据 字典 ,进行 合法 权限 检 
查 。 如 果 用 户 的 操作 请 求 没有 超出 其 数据 操作 权限 , 则 准予 执行 该 数据 操作 ; 否则 系统 将 
拒绝 执行 此 操作 。 

(2) 存 取 控制 机 制 的 类 别 

当前 ,大 多 数 DBMS 所 采用 的 存 取 控制 策略 主要 有 两 种 : 自主 存 取 控制 和 强制 存 取 控 
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制 。 其 中 ,自主 存 取 控 制 的 使 用 更 为 普遍 ,也 有 些 系 统 两 者 都 支持 。 下 面 分 别 介绍 这 两 种 
方法 。 

@ 自主 存 取 控制 

在 自主 存 取 控制 (Discretionary Access Control, DAC) 方 法 中 ,用 户 对 于 不 同 的 对 象 有 
不 同 的 存 取 权限 ,不 同 的 用 户 对 同一 对 象 的 存 取 权限 也 各 不 相同 ,用 户 可 将 自己 拥有 的 存 取 
权限 转 授 给 其 他 用 户 。 很 明显 ,自主 存 取 控制 比较 灵活 。 

@ 强制 存 取 控制 

在 强制 存 取 控制 (Mandatory Access Control, MAC) 方 法 中 ,每 一 个 数据 对 象 被 标 以 一 
定 的 密级 ,每 一 个 用 户 也 被 授予 某 一 个 级 别 的 许可 证 。 对 于 任何 一 个 对 象 ,只 有 上 有 具有 合法 许 
可 证 的 用 户 才 可 以 存 取 。 与 自主 存 取 控制 相 比 ,强制 存 取 控制 比较 严格 。 

(3) 自主 存 取 控制 方法 

SQL 对 自主 存 取 控制 提供 了 支持 ,其 DCL 主要 是 通过 GRANT( 授 权 ) 语 句 和 
REVOKE( 收 权 ) 语 句 来 实现 的 。 

@ 关系 数据 库 中 的 存 取 权 限 

存 取 权限 是 由 数据 对 象 和 操作 类 型 组 成 的 。 在 数据 库 系统 中 ,定义 用 户 的 存 取 权 限 称 
为 授权 , 即 规定 可 以 对 数据 库 中 的 哪些 数据 对 象 进行 哪些 操作 。 如 果 用 户 的 操作 超出 了 系 
统 对 他 的 授权 , 则 该 操作 将 不 会 被 执行 。 

关系 数据 库 系 统 的 存 取 权 限 如 表 6-1 所 示 。 

表 6-1 关系 数据 库 系统 的 存 取 权限 


建立 ,修改 ,检索 


模式 建立 ,修改 、 检 索 
建立 ,修改 检索 
数据 查找 \ 插 入. 修改、 删除 


查找 、 插 入 修改、 删除 


@ SQL 的 数据 控制 功能 

SQL 的 数据 控制 功能 包括 GRANT( 授 权 ) 语 句 和 了 REVOKE( 收 权 ) 语 句 。 

。 数据 对 象 的 创建 者 自动 获得 对 于 该 数据 对 象 的 所 有 操作 权限 。 例 如 ,学 生 表 
(STUDENT ) 的 创建 者 自动 获得 对 该 表 的 SELECT 、INSERT、UPDATE 和 
DELETE 等 权限 。 

。 获得 数据 操作 权 的 用 户 可 以 通过 GRANT 语句 把 权限 转 授 给 其 他 用 户 。 

GRANT 语句 的 一 般 格式 为 : 

GRANT < 权限 > [,< 权 限 >] … 

ON < 对 象 类 型 > < 对 象 名 >[ ,< 对 象 类 型 > < 对 象 名 >] … 


TO < 用 户 > [,< 用 户 > ] 
[WITH GRANT OPTION] 


例如 : 


GRANT SELECT, INSERT 
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ON STUDENT “TO 张 觅 
WITH GRANT OPTION 


执行 结果 是 将 学 生 表 的 SELECT 和 INSERT 权限 授予 给 了 用 户 张 鹏 ,同时 张 鹏 还 获 
得 了 “授权 ”权限 , 即 可 以 把 得 到 的 权限 继续 授予 其 他 用 户 。 
。 当 用 户 将 某 些 权 限 授 给 其 他 用 户 后 ,有 时 还 需要 把 权限 收回 。 收 回 权限 使 
REVOKE 语句 。 
REVOKE 语句 的 一 般 格式 为 : 
REVOKE < 权限 > [,< 权 限 >] … 
ON < 对 象 类 型 > < 对 象 名 >[ ,< 对 象 类 型 > < 对 象 名 >] … 


FROM < 用 户 > [,< 用 户 > ] 
[CASCADE | RESTRICT] 


例如 : 
REVOKE INSERT ON STUDENT FROM 张 月 


执行 结果 是 收回 张 鹏 对 STUDENT 表 的 插入 权限 。 

@ 授权 机 制 的 性 能 

衡量 授权 机 制 灵活 性 的 一 个 重要 指标 就 是 授权 粒度 , 即 可 定义 的 数据 对 象 范围 。 授 权 
粒度 越 细 ,可 定义 的 数据 对 象 范围 越 小 ,授权 机 制 越 灵活 。 

@ 自主 存 取 控 制 的 不 足 之 处 

自主 存 取 控制 能 够 通过 授权 机 制 有 效 地 控制 用 户 对 敏感 数据 的 存 取 ,但 也 存在 着 一 定 
的 缺陷 ,其 主要 问题 是 系统 无 法 对 授权 的 授予 状况 进行 有 效 的 控制 ,因此 有 可 能 造成 数据 的 
无 意 泄露 。 例 如 , 甲 将 自己 权限 范围 内 的 某 些 数据 存 取 权限 授权 给 乙 , 甲 的 本 意 是 只 允许 乙 
本 人 操作 这 些 数据 。 但 是 甲 的 这 种 安全 性 要 求 并 不 能 够 得 以 保证 ,因为 乙 一 旦 获得 数据 的 
权限 ,就 可 以 把 数据 备份 ,获得 自身 权限 内 的 副本 ,在 不 征 得 甲 同 意 的 前 提 下 进行 副本 传播 ， 
从 而 造成 数据 泄露 。 造 成 这 个 问题 的 根本 原因 在 于 ,自主 存 取 控制 机 制 仅仅 通过 对 数据 的 
存 取 权限 进行 安全 性 控制 ,而 数据 本 身 并 没有 安全 性 标记 。 强 制 存 取 控 制 方法 则 可 以 有 效 
解决 这 一 问题 。 

(4) 强制 存 取 控 制 方法 

一 般 情 况 下 ,自主 存 取 控制 是 很 有 效 的 ,可 以 满足 普通 的 安全 性 要 求 。 但 它 存在 一 个 漏 
洞 : 一 些 别 有 用 心 的 用 户 可 以 欺骗 一 个 授权 用 户 , 采 用 一 定 的 手段 来 获取 敏感 数据 。 存 在 
这 种 漏洞 的 根源 在 于 ,自主 存 取 控制 机 制 仅 以 授权 来 将 主体 (用 户 ) 与 客体 (被 存 取 数据 对 
象 ) 关 联 , 通 过 控制 权限 来 实现 安全 要 求 ,对 主体 和 客体 (对 象 ) 本 身 未 做 任何 安全 性 标注 。 
强制 存 取 控 制 (MAC) 能 够 处 理 自主 存 取 控制 的 这 种 漏洞 问题 。 

通用 的 强制 存 取 控制 机 制 将 被 存 取 的 物体 称 为 客体 或 对 象 (Object) ,如 文件 .关系 、 模 
式 、 视 图 索引、 记录 /元 组 等 ; 将 存 取 客体 者 称 为 主体 (Subject) ,包括 用 户 和 程序 ; 它 给 每 
一 个 客体 指派 一 个 安全 等 级 (Security class) ,而 给 每 一 个 主体 指派 一 个 安全 等 级 的 许可 证 
(CClearance) 。 安 全 级 别 (主体 和 客体 的 统一 ) 按 偏 序 组 织 , 例 如 绝密 (top secret,TS) 二 机 密 
(secret,S) 二 秘密 (confidential,C) 二 无 密 Cunclassified,.U) ,这 里 “二 ”表示 安全 级 别 的 “高 
于 ”关系 , 它 是 一 个 偏 序 关 系 。 


第 6 章 ”数据 库 保护 


强制 存 取 控 制 机 制 使 用 两 条 安全 性 规则 : 

g@ 主体 A 可 以 读 取 客 体 O 的 必要 充分 条 件 是 CL(A) 宇 SC(O) 

@ 主体 A 可 以 更 新 客体 O 的 必要 充分 条 件 是 CL(A) 二 SC(O) 

其 中 ,CL(CA) 和 SC(O) 分 别 表示 主体 A 的 许可 证 等 级 和 客体 O 的 安全 等 级 。 规 则 中 
的 意义 很 明确 ,规则 四 可 以 用 另 一 种 形式 表述 : 一 个 主体 所 写 的 对 象 的 密级 自动 为 主体 的 
许可 证 级 别 。 这 两 个 规则 控制 了 比 对 象 的 密级 更 高 的 用 户 只 能 读 而 不 能 更 新 该 对 象 ; 密级 
更 低 的 用 户 既 不 能 读 也 不 能 更 新 ; 只 有 同 级 的 用 户 才 既 能 读 又 能 更 新 。 这 也 就 防止 了 自主 
存 取 控制 关于 “复制 ”的 漏洞 。 

强制 存 取 控 制 方案 的 优点 是 它 更 严密 ,而 其 主要 缺点 就 在 于 它 。sQL 语 义 分 析 & 语 义 检查 
的 “刚性 ”" 太 强 , 其 安全 策略 必须 由 DBA 设置 ,而 且 在 安全 分 级 机 制 
等 方面 也 不 够 灵活 。 将 自主 和 强制 存 取 控 制 组 合 起 来 效果 会 更 理 
想 些 ,可 以 在 强制 存 取 控 制 下 再 施加 自主 存 取 控制 。 这 样 ,一 个 用 
户 要 存 取 一 个 数据 库 对 象 ,他 必须 有 相应 的 存 取 权限 (经 授权 获 
得 ), 且 他 的 许可 证 等 级 与 该 对 象 的 密级 必须 受到 相关 规则 的 约束 。 

实现 MAC 时 首先 要 实现 DAC, 即 DAC 与 MAC 共同 构成 1 
DBMS 的 安全 机 制 ,如 图 6-2 所 示 。 系 统 在 进行 安全 检查 时 ,首先 进 继续 语义 检查 
行 自主 存 取 控 制 检查 ,然后 进行 强制 存 取 控制 检查 ,两 者 都 通过 后 ， 图 6-2 DAC+MAC 


用 户 才能 执行 其 数据 存 取 操作 。 安全 性 检查 
3. 视图 机 制 
进行 存 取 的 控制 ,不 仅 可 以 通过 授权 与 收回 权力 来 实现 ,还 可 以 通过 定义 用 户 的 外 模式 


来 提供 一 定 的 安全 保护 功能 。 在 关系 系统 中 ,就 是 为 不 同 的 用 户 定义 不 同 的 视图 ,通过 视图 
机 制 把 要 保密 的 数据 对 无 权 存 取 这 些 数 据 的 用 户 隐藏 起 来 ,从 而 自动 地 对 数据 提供 一 定 程 
度 的 安全 保护 。 


4. 审计 


用 户 识别 和 鉴定 、 存 取 控 制 、 视 图 等 安全 性 措施 均 为 强制 性 机 制 ,将 用 户 操作 限制 在 规 
定 的 安全 范围 内 。 但 实际 上 任何 系统 的 安全 性 措施 都 不 可 能 是 完美 无 缺 的 ,蓄意 盗窃 ,破坏 
数据 的 人 总 会 想方设法 打破 控制 。 所 以 , 当 数据 相当 敏感 ,或 者 对 数据 的 处 理 极为 重要 时 ， 
就 必须 以 审计 追踪 技术 作为 预防 手段 ,监测 可 能 发 生 的 不 合法 行为 。 

审计 追踪 使 用 的 是 一 个 专用 文件 或 数据 库 , 系 统 自动 将 用 户 对 数据 库 的 所 有 操作 记录 
在 上 面 ,利用 审计 追踪 的 信息 ,就 能 重 现 导致 数据 库 现 有 状况 的 一 系列 事件 ,以 找 出 非法 存 
取 数 据 的 人 、 时 间 和 内 容 等 。 

审计 追踪 通常 是 很 费时 间 和 空间 的 ,所 以 一 般 DBMS 把 审计 功能 作为 可 选 特性 ,DBA 
可 以 根据 需要 灵活 地 打开 或 者 关闭 审计 功能 。 审 计 功 能 一 般 用 于 对 安全 性 要 求 较 高 的 
部 门 。 


5. 数据 加 密 


前 面 所 述 的 数据 库 安全 措施 都 是 在 DBMS 的 管理 控制 下 起 作用 的 ,现在 的 问题 是 有 人 
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会 有 意 或 者 无 意 地 绕 过 或 者 避 开 DBMS 而 窃取 数据 。 所 以 对 于 高 度 敏感 性 数据 ,如 财务 数 
据 、 军 事 数据 和 国家 机 密 , 除 了 采取 上 述 安 全 性 措施 外 ,还 可 以 采用 数据 加 密 技 术 ,以 密码 形 
式 存储 和 传输 数据 。 加 密 的 目的 是 使 未 授权 的 人 不 能 识别 ,也 不 知道 如 何 识别 ,这 样 就 无 法 
企图 通过 不 正常 渠道 获取 数据 ,例如 ,利用 系统 安全 措施 的 漏洞 非法 访问 数据 ,或 者 在 通信 
线路 上 窃取 数据 ,而 只 能 看 到 一 些 无 法 辨认 的 二 进 制 代 码 。 用 户 正 常 检索 数据 时 ,首先 要 提 
供 密码 钥匙 ,由 系统 进行 译 码 后 才能 得 到 可 识别 的 数据 ,也 就 是 将 密 文 转变 为 明文 ,这 个 过 
程 称 为 解密 ,是 加 密 的 逆 过 程 。 
目前 不 少数 据 库 产品 都 提供 了 数据 加 密 例 行 程序 ,可 根据 用 户 的 要 求 自动 对 存储 和 传 
输 的 数据 进行 加 密 处 理 。 另 外 一 些 数据 库 产品 虽然 本 身 未 提供 加 密 程 序 , 但 是 提供 了 接口 ， 
允许 用 户 用 其 他 厂商 的 机 密 程序 对 数据 加 密 。 所 有 提供 加 密 机 制 的 系统 必然 也 提供 相应 的 
解密 程序 。 这些 解 密 程序 本 身 也 必须 具有 一 定 的 安全 性 保护 措施 ,否则 数据 加 密 的 优点 也 
就 遗失 列 尽 了 。 

数据 加 密 和 解密 程序 也 是 比较 费时 的 ,而 且 数据 加 密 和 解密 程序 会 占用 大 量 的 系统 资 
源 ,所 以 数据 加 密 功能 通常 也 作为 可 选 特性 ,用 户 可 以 根据 需要 自由 选择 只 对 高 度 机 密 的 数 
据 加 密 。 


6.2 数据 库 完整 性 


数据 库 的 完整 性 是 指 保证 数据 库 数据 的 正确 性 和 相 容 性 ,防止 错误 的 数据 进入 数据 库 。 
数据 库 是 否 具备 完整 性 关系 到 数据 库 系统 能 否 真 实地 反映 现实 世界 ,因此 维护 数据 库 的 完 
整 性 是 非常 重要 的 。 


6.2.1 完整 性 概述 


数据 库 的 完整 性 和 安全 性 是 两 个 不 同 的 概念 。 前 者 是 为 了 防止 数据 库 中 存在 不 符合 语 
义 的 数据 ,防止 错误 信息 的 输入 和 输出 , 即 所 谓 垃圾 进 垃 圾 出 所 造成 的 无 效 操作 和 错误 结 
果 ; 而 后 者 是 保护 数据 库 ,防止 恶意 的 破坏 和 非法 的 存 取 。 也 就 是 说 ,安全 性 措施 的 防范 对 
象 是 非法 用 户 和 非法 操作 ,完整 性 措施 的 防范 对 象 是 不 合 语义 的 数据 。 当 然 ,完整 性 和 安全 
性 是 密切 相关 的 。 安 全 性 可 以 用 用 户 对 数据 库 的 操作 权限 来 表示 ,完整 性 可 以 用 完整 性 约 
东 来 表示 。 用 户 操作 权限 和 完整 性 约束 都 存储 在 数据 库 管理 系统 的 数据 字典 中 。 数 据 库 的 
安全 性 和 完整 性 都 由 DBMS 来 确保 。 

为 维护 数据 库 的 完整 性 .DBMS 必须 提供 一 种 机 制 来 检查 数据 库 中 的 数据 ,看 其 是 否 
满足 语义 规定 的 条 件 , 这 些 语义 约 东 条件 称 为 数据 库 完整 性 约 东 条件 。 数 据 库 中 的 完整 性 
约 东 条 件 实际 上 是 数据 语义 的 表示 形式 ,是 由 用 户 定义 的 。 大 部 分 约 东 条 件 可 在 定义 数据 
模式 时 定义 ,成 为 数据 模式 的 一 部 分 。 数 据 库 完整 性 约束 的 种 类 很 多 ,可 以 根据 数据 的 实际 
语义 和 用 户 的 业务 规则 或 政策 定义 数据 上 的 完整 性 约束 。 

目前 ,许多 RDBMS 提供 了 多 种 定义 完整 性 约束 条 件 的 功能 和 检查 是 否 违背 完整 性 约 
束 条 件 的 机 制 , 称 为 完整 性 检查 。RDBMS 若 发 现 用 户 的 操作 使 数据 库 违 背 了 完整 性 约束 
条 件 ,将 采取 一 定 的 措施 拒绝 用 户 执行 该 操作 。 数 据 完 整 性 检查 一 般 设置 在 引起 数据 库 状 
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态 改变 的 操作 上 ,不 引起 数据 库 状 态 改变 的 查询 等 操作 不 会 破坏 数据 库 的 完整 性 。 

数据 库 的 完整 性 规则 主要 包括 实体 完整 性 .参照 完整 性 .用 户 定义 完整 性 。 除 此 之 外 ， 
还 有 域 完整 性 。 域 完整 性 也 可 以 称 为 列 完整 性 ,用 于 指定 一 个 数据 集 对 某 一 个 列 是 否 有 效 
和 确定 ,是否 人 允许 空 值 。 域 完整 性 通常 是 使 用 有 效 性 检查 来 实现 的 ,并 且 还 可 以 通过 限制 数 
据 类 型 .格式 或 者 可 能 的 取 值 范围 来 实现 。 例 如 ,在 性 别 列 中 ,限制 其 取 值 范围 为 * 男 ”和 
“ 女 ”, 这 样 该 列 就 不 会 输入 其 他 一 些 无 效 的 值 。 


6.2.2 完整 性 约束 条 件 


完整 性 控制 都 是 围绕 完整 性 约束 条 件 进行 的 ,从 这 个 角度 说 ,完整 性 约束 条 件 是 完整 性 
控制 机 制 的 核心 。 

完整 性 约束 条 件 作用 的 对 象 可 以 有 列 级 .元 组 级 和 关系 级 三 种 粒度 。 其 中 对 列 的 约束 
主要 指 对 其 取 值 类 型 .范围 ,精度 和 排序 等 的 约束 条 件 。 对 元 组 的 约束 是 指 对 记录 中 各 个 字 
段 间 联 系 的 约束 。 对 关系 的 约束 是 指 对 各 记录 间或 关系 之 间 联 系 的 约束 。 

完整 性 约束 条 件 设计 的 这 三 类 对 象 , 其 状态 可 以 是 静态 的 ,也 可 以 是 动态 的 。 其 中 对 静 
态 对 象 的 约束 是 反映 数据 库 状 态 合 理性 的 约束 ,这 是 最 重要 的 一 类 完整 性 约束 。 对 动态 对 
象 的 约束 是 反映 数据 库 状态 变迁 的 约束 。 完 整 性 约束 条 件 可 以 分 为 六 类 。 


1. 静态 列 级 约束 
静态 列 级 约束 是 对 一 个 列 的 取 值 域 的 说 明 , 这 是 最 常见 .最 容易 实现 的 一 类 完整 性 约 
束 , 包 括 以 下 几 个 方面 。 


(1) 对 数据 类 型 的 约束 
包括 数据 的 类 型 .长度 .单位 和 精度 等 。 例 如 ,学 生 -课程 数据 库 中 学 生 姓 名 的 数据 类 型 
为 字符 型 ,长度 为 8。 教师 数据 库 中 教师 的 工资 类 型 为 货币 型 。 
(2) 对 数据 格式 的 约束 
例如 ,规定 职工 编号 前 两 位 为 参加 工作 年 份 ,中 间 两 位 为 部 门 编号 ,后 四 位 为 顺序 编号 。 
(3) 对 取 值 范围 或 取 值 集合 的 约束 
如 ,规定 职工 性 别 只 能 取 自 集合 [ 男 , 女 ], 职 工 年 龄 只 能 是 20 一 55 岁 。 
(4) 对 空 值 的 约束 
值 表示 未 知 或 未 赋值 .与 零 值 和 空 字符 不 同 。 有 的 列 可 以 取 空 值 ,有 的 不 可 以 。 例 
如 ,职工 编号 不 能 取 空 值 ,联系 电话 不 能 取 空 值 。 
(5) 其 他 约束 
例如 列 排序 说 明 、 列 组 合 等 。 


宣 


出 


2. 静态 元 组 约束 


一 个 元 组 是 由 若干 个 列 值 组 成 的 ,静态 元 组 约束 就 是 规定 组 成 一 个 元 组 的 各 个 列 之 间 
的 约束 关系 。 

静态 元 组 约束 只 局 限 在 单个 元 组 上 ,因此 比较 容易 实现 。 例 如 ,在 图 书 借阅 表 中 可 以 规 
定 : 还 书 日 期 之 借 书 日 期 。 
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3. 静态 关系 约束 


在 一 个 关系 的 各 个 元 组 之 间或 者 若干 关系 之 间 常 常 存 在 各 种 联系 或 约束 。 常 见 的 静态 
关系 约 东 有 以 下 四 种 : 

(1) 实体 完整 性 约束 。 

(2) 参照 完整 性 约束 。 

(3) 函数 依赖 约束 。 

(4) 统计 约束 , 即 某 个 字段 值 与 一 个 关系 多 个 元 组 的 统计 值 之 间 的 约束 关系 。 例 如 , 规 
定 部 门 经 理 的 工资 不 得 高 于 本 部 门 职工 平均 工资 的 4 信 , 不 得 低 于 本 部 门 职工 平均 工资 的 
2 倍 ,本 部 门 职 工 的 平均 工资 就 是 一 个 统计 值 。 


4. 动态 列 级 约束 


动态 列 级 约束 是 修改 列 定义 或 列 值 时 要 满足 的 约束 条件, 包括 以 下 两 方面 。 

(1) 修改 列 定义 时 的 约 东 

例如 ,将 原来 允许 为 空 值 的 列 改 为 不 可 以 为 空 值 ,如 果 之 前 已 经 取 空 值 , 则 拒绝 本 次 
修改 。 

(2) 修改 列 值 时 的 约束 

修改 列 值 时 需要 参考 该 列 之 前 的 旧 值 ,并且 新 旧 值 之 间 满 足 某 种 约束 关系 。 例 如 ,职工 
新 工资 不 能 低 于 原来 的 工资 ,学 生年 龄 只 能 增长 而 不 能 减少 。 


5. 动态 元 组 约束 


动态 元 组 约束 是 指 修改 某 个 元 组 时 需要 参照 其 旧 值 ,并 且 新 旧 值 之 间 需 要 满足 某 种 约 
束 条 件 。 例 如 ,教师 表 中 有 职称 和 工资 字段 ,规定 调整 工资 时 教授 的 工资 不 得 低 于 5000 元 。 


6. 动态 关系 约束 


动态 关系 约束 是 加 在 关系 变化 前 后 状态 上 的 限制 条 件 , 例 如 事务 一 致 性 ,原子 性 等 约束 
条 件 。 


6.2.3 完整 性 控制 
1. 完整 性 约束 的 定义 


DBMS 的 完整 性 控制 机 制 应 具有 三 个 方面 的 功能 : 

(1) 定义 功能 : 提供 定义 完整 性 约束 条 件 的 机 制 。 

(2) 检查 功能 : 检查 用 户 发 出 的 操作 请 求 是 否 违背 了 完整 性 约束 条 件 。 

(3) 如 果 发 现 用 户 的 操作 请 求 使 数据 违背 了 完整 性 约束 条 件 , 则 采取 一 定 的 动作 来 保 
证 数据 的 完整 性 。 


2. 对 违背 了 完整 性 约束 条 件 的 操作 应 采取 的 措施 
对 于 违反 实体 完整 性 规则 和 用 户 定义 的 完整 性 规则 的 操作 一 般 都 是 采用 拒绝 执行 的 方 


第 6 章 ”数据 库 保护 


式 进行 处 理 。 而 对 于 违反 参照 完整 性 的 操作 ,并 不 都 是 简单 地 拒绝 执行 ,有 时 还 需要 采取 另 
一 种 方法 , 即 接受 这 个 操作 ,同时 执行 一 些 附 加 的 操作 ,以 保证 数据 库 的 状态 仍然 是 正确 的 。 

(1) 删除 被 参照 关系 的 元 组 时 的 考虑 

@ 级 联 删除 (Cascades) 。 将 参照 关系 中 所 有 外 码 值 与 被 参照 关系 中 要 删除 元 组 主 码 
值 相 对 应 的 元 组 一 并 删除 。 如 果 参 照 关 系 同 时 又 是 另 一 个 关系 的 被 参照 关系 , 则 这 种 删除 
会 继续 级 联 下 去 。 例 如 ,要 删除 学 生 表 Student 中 * 学 号 = '2007111001'” 的 学 生 , 则 一 起 删 
除 选 课表 SC 中 所 有 “学 号 = 二 '2007111001'” 的 元 组 。 

@ 受 限 删除 (Restricted) 。 只 有 当 参 照 关 系 中 没有 任何 元 组 的 外 码 值 与 要 删除 的 被 参 
照 关 系 的 主 码 值 相对 应 时 ,系统 才 执行 删除 操作 ,和 否则 拒绝 执行 。 例 如 ,如 果 SC 表 中 有 ”学 
号 三 '2007111001" 的 学 生 的 选课 记录 , 则 上 面 删除 学 生 表 Student 中 * 学 号 = '2007111001"” 的 
学 生 的 操作 将 被 拒绝 执行 。 

@ 删除 值 空置 (Nullifies)。 删 除 被 参照 关系 中 的 元 组 ,并 将 参照 关系 中 所 有 与 被 参照 
关系 中 删除 元 组 主 码 值 相等 的 外 码 值 置 为 空 值 。 例 如 ,上 面 将 SC 表 中 的 所 有 “学 号 一 
'2007111001'” 的 元 组 的 学 号 置 为 空 值 。 

对 于 这 三 种 处 理 方法 ,要 根据 应 用 环境 的 语义 来 确定 采用 哪 一 种 最 为 恰当 。 例 如 ,一 
学 生 毕 业 或 者 退学 了 ,他 的 记录 就 应 该 从 Student 表 中 删除 ,同样 ,他 的 选课 记录 也 应 该 从 
SC 表 中 一 起 全 部 删除 。 

(2) 修改 被 参照 关系 中 主 码 的 考虑 

@ 级 联 修 改 (Cascades)。 修 改 被 参照 关系 中 的 主 码 值 的 同时 修改 参照 关系 中 与 之 对 
应 的 外 码 值 。 如 ,学 生 表 Student 中 “学 号 = 二 '2007111001'” 的 元 组 修改 为 “学 号 = 
'2007111002'”, 则 同时 将 选课 表 SC 中 所 有 “学 号 = 二 '2007111001'” 的 元 组 修改 为 “学 号 = 
'2007111002'”。 

@ 受 限 修改 (Restricted) 。 拒 绝 此 修改 操作 。 只 有 当 参 照 关 系 中 没有 任何 元 组 的 外 码 
值 与 被 参照 关系 中 某 一 个 元 组 的 主 码 值 相 等 时 , 才 允 许 此 修改 操作 ,否则 拒绝 执行 。 例 如 ， 

只 有 当 SC 表 中 没有 “学 号 = '2007111001" 的 元 组 时 , 才 人 允许 对 学 生 表 Student 将 “学 号 一 
'2007111001'” 的 元 组 修改 为 “学 号 =='2007111002'”。 

@ 修改 值 空置 (Nullifies)。 修 改 被 参照 关系 中 的 主 码 值 ,同时 把 参照 关系 中 相应 的 外 
码 值 置 为 空 值 。 例 如 , 把 Student 表 中 的 “学 号 二 '2007111001'” 的 元 组 修改 为 “学 号 = 
'2007111002'”, 同 时 把 SC 表 中 “学 号 =='2007111002'” 的 元 组 的 学 号 置 为 空 值 。 

对 于 这 三 种 处 理 方法 ,同样 要 根据 应 用 环境 的 语义 来 确定 采用 哪 一 种 最 为 恰当 。 

(3) 外 码 是 否 可 以 接受 空 值 

外 码 是 否 可 以 接受 空 值 是 由 其 语义 来 决定 的 。 在 职工 -部 门 数 据 库 中 ,“ 职 工 " 关 系 包含 
有 外 码 “ 部 门 号 ”, 某 一 元 组 的 这 一 列车 为 空 值 ,表示 这 一 职工 尚未 分 配 到 任何 具体 的 部 门 工 
作 ; 这 和 应 用 环境 的 语义 是 相符 的 ,因此 “职工 ” 表 的 “部 门 号 ” 列 应 允许 空 值 。 但 在 学 生 - 选 
课 数据 库 中 ,“ 学 生 ” 关 系 为 被 参照 关系 ,其 主 码 为 “学 号 ”;“ 选 课 ”" 关 系 为 参照 关系 ,外 码 为 
“学 号 ”, 如 果 学 号 为 空 值 , 则 无 法 表示 何人 选修 了 某 门 课程 ,这 和 应 用 环境 的 语义 是 不 相符 
的 ,因此 “选课 " 表 的 “学 号 " 列 不 能 为 空 值 。 

从 上 面 的 讨论 可 以 看 出 ,DBMS 在 实现 参照 完整 性 时 ,除了 要 提供 定义 主 码 、 外 码 机 制 
外 ,还 需要 提供 不 同 的 策略 供用 户 选 择 。 无 论 哪 一 种 策略 ,都 应 该 根据 应 用 环境 的 具体 要 求 
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来 确定 ,选择 一 种 最 为 适当 的 处 理 方式 。 
6.3 数据 库 并 发 控制 


数据 库 是 一 个 可 以 供 多 个 用 户 共享 的 信息 资源 。 当 多 个 用 户 并 行 地 存 取 数据 库 时 ,就 
会 产生 多 个 事务 同时 存 取 同 一 数据 的 情况 。 如 果 对 并 发 操作 不 加 以 控制 就 可 能 会 出 现存 取 
不 正确 数据 的 情况 ,进而 破坏 数据 库 的 一 致 性 。 因 此 ,DBMS 必须 提供 并 发 控制 机 制 。 并 
发 控制 机 制 的 好 坏 是 衡量 数据 库 管 理 系统 性 能 的 重要 指标 之 一 。 


6.3.1 事务 概述 
1. 事务 的 定义 


事务 是 数据 库 的 基本 逻辑 工作 单位 , 它 包 括 用 户 定义 的 一 系列 操作 ,这些 操作 要 么 全 做 
要 么 全 不 做 ,是 一 个 不 可 分 割 的 基本 单位 。 一 个 事务 可 以 是 一 条 SQL 语句 、 一 组 SQL 语句 
或 一 段 程序 。 事 务 和 程序 是 两 个 概念 ,一般 地 ,一 个 程序 中 包含 多 个 事务 。 事 务 的 开始 与 结 
束 可 以 由 用 户 显 式 地 定义 ,也 可 以 由 系统 按 缺 省 规定 自动 划分 。 

数据 库 的 主要 责任 是 保存 信息 ,因此 它 需 要 向 用 户 提供 保存 当前 程序 状态 的 方法 。 同 
样 , 当 事务 执行 过 程 中 发 生 错 误 时 ,需要 有 一 种 方法 使 数据 库 忽 略 当前 的 状态 ,并 回 到 前 面 
保存 的 程序 状态 。 这 两 种 情况 在 数据 库 用 语 中 分 别称 为 提交 事务 和 回 深 事 务 。 在 SQL 语 
言 中 ,定义 事务 的 语句 有 三 条 : 

BEGIN TRANSACTION; 

COMMIT; 

ROLLBACK; 

通常 ,事务 以 BEGIN TRANSACTION 开始 ,以 COMMIT 或 者 ROLLBACK 结束 。 
COMMIT 表示 事务 的 提交 , 即 提交 事务 的 所 有 操作 ,事务 提交 是 将 事务 中 所 有 对 数据 的 更 
新 写 回 到 磁盘 上 的 物理 数据 库 中 ,事务 正常 结束 ; ROLLBACK 表示 事务 的 回 深 , 即 事务 在 
运行 过 程 中 发 生 某 种 故障 ,事务 无 法 继续 执行 下 去 ,系统 将 事务 中 对 数据 库 的 所 有 更 新 操作 
全 部 撤销 , 回 滚 到 执行 事务 前 的 状态 。 


2. 事务 的 特性 


事务 具备 四 个 特性 , 即 原子 性 (Atomicity) .一致 性 (Consistency) .隔离 性 (Isolation) 和 
持久 性 (Durability) ,简称 为 ACID 特性 。 

(1) 原子 性 

原子 性 就 是 事务 执行 的 原子 性 。 事 务 是 一 个 不 可 分 割 的 工作 单元 ,事务 中 包括 的 诸 操 
作 要 么 全 部 执行 ,要 么 全 部 不 执行 。 

(2) 一 致 性 
有 务 的 一 致 性 指 的 是 一 个 事务 执行 完成 ,数据 库 从 一 个 一 致 性 的 状态 转换 到 另 一 个 一 
致 性 状态 , 即 它 是 事务 在 其 两 个 端点 处 必须 保证 数据 库 的 正确 性 的 一 种 限制 。 例 如 , 某 公司 
在 银行 有 A、B 两 个 账户 ,两 个 账户 之 间 进 行 转账 ,从 A 账户 取出 1000 元 存 和 人 B 账户 。 该 
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事务 里 包含 两 个 操作 : 一 个 操作 是 从 账户 A 中 减 去 1000 元 , 另 一 个 操作 是 向 账户 B 存 入 
1000 元 。 这 两 个 操作 要 么 全 做 ,要 么 全 不 做 ,这 样 都 会 使 数据 库 处 于 一 致 性 状态 。 如 果 只 
做 其 中 一 个 操作 ,那么 用 户 逻 辑 上 会 发 生 错 误 , 少 了 1000 元 ,这 时 数据 库 就 处 于 不 一 致 状 
态 。 可 见 一 致 性 和 原子 性 密切 相关 。 

(3) 隔离 性 

原子 性 和 一 致 性 只 能 保证 单个 事务 天 折 或 成 功 完成 时 数据 库 的 正确 状态 。 当 多 个 事务 
并 发 执行 时 , 因 其 互相 干扰 可 能 会 导致 数据 库 的 最 终 状 态 是 不 正确 的 。 因 此 DBMS 必须 对 
它们 的 执行 给 予 一 定 的 控制 ,使 若干 并 发 执行 的 结果 等 价 于 它们 一 个 接 一 个 地 串 行 执行 的 
结果 。 也 就 是 说 ,事务 在 执行 过 程 中 是 互 不 干扰 的 ,相互 隔离 的 。 
(4) 持久 性 
持久 性 是 指 一 个 事务 一 经 提交 , 它 的 影响 永久 性 地 产生 在 系统 中 ,也 就 是 说 其 修改 操作 
写 到 了 数据 库 中 。 这 种 特性 也 称 为 永久 性 。 
事务 机 制 的 这 些 属 性 保证 了 数据 的 一 致 性 ,确保 了 在 系统 失败 时 的 可 恢复 性 。 


6.3.2 并 发 控制 概述 
并 发 控制 是 指 在 多 用 户 的 环境 下 ,对 数据 库 并 发 操作 进行 规范 的 机 制 。 其 目的 是 避免 
对 数据 的 丢失 修改 . 读 脏 数据 与 不 可 重复 读 等 ,从 而 保证 数据 的 正确 性 与 一 致 性 。 

并 发 控制 在 多 用 户 模式 下 是 十 分 重要 的 ,但 这 一 点 经 常 被 一 些 数据 库 开发 人 员 忽 视 ,而 
且 因 为 并 发 控制 的 层次 和 类 型 非常 丰富 ,有 时 使 人 们 在 选择 时 比较 迷惑 ,不 清楚 衡量 并 发 控 
制 层次 选择 的 原则 和 途径 。 


1. 并 发 操作 可 能 产生 的 问题 


为 了 更 好 地 理解 并 发 控制 的 概念 , 先 看 一 个 常见 的 并 发 操作 的 例子 。 
银行 数据 库 中 有 一 个 账户 表 , 其 主要 信息 如 表 6-2 所 示 。 
表 6-2 Account( 账 户 ) 表 主要 信息 


属性 名 称 属性 含义 属性 类 型 
Id( 键 值 列 ) 账户 号 Char(10) 
Uname 户主 Char(10) 
Mdeposit 存 人 金额 Currency 
Mpayout 支出 金额 Currency 
Mbalance 存款 余额 Currency 


某 户主 代表 在 银行 A 前 台 取 款 2000 元 ,银行 A 出 纳 查询 用 户 的 存款 信息 显示 银行 存 
款 余额 20 000 元 ,正在 这 时 ,银行 了 账户 转账 支票 支付 该 账户 5000 元 ,机 器 查询 也 得 到 当 
前 用 户 存款 20 000 元 ,这 时 银行 A 的 出 纳 员 看 到 用 户 存款 超过 了 取款 额 ,就 支付 了 客户 
2000 元 并 将 用 户 存 款 改 为 18 000 元 ,而 银行 B 的 操作 员 根 据 支 票 ,将 汇 人 的 5000 元 加 上 ， 
把 用 户 的 余额 改 为 25 000 元 。 很 明显 ,银行 将 会 损失 2000 元 ,因为 银行 A 的 出 纳 员 所 做 的 
修改 被 覆盖 了 。 

这 是 由 于 对 并 发 操作 控制 失败 造成 的 ,由 于 没有 对 两 个 并 发 操作 进行 合理 的 隔离 ,并 对 
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数据 进行 合理 的 锁定 ,导致 经 出 纳 员 查询 所 得 到 的 客户 端 数据 集 与 数据 库 的 数据 不 一 致 , 结 
果 便 产生 了 丢失 修改 。 

当 多 个 用 户 访 问 相 同 的 数据 时 ,可 能 会 出 现 三 种 问题 。 

(1) 丢失 修改 (Lost Update) : 如 果 一 个 事务 通过 某 种 查询 获取 了 数据 , 另 一 个 事务 修 
改 了 该 数据 的 一 部 分 ,那么 原来 的 事务 第 二 次 获取 该 数据 时 ,就 会 发 生 虚 读 , 产 生 丢失 修改 。 
上 面 的 例子 中 , 当 银 行 A 执行 取款 时 ,此 时 银行 B 已 修改 余额 ,可 是 银行 A 获取 的 数据 仍 为 
原 数据 ,从 而 产生 丢失 修改 。 

(2) 脏 读 (Dirty Read) : 如 果 一 个 应 用 程序 使 用 了 被 另 一 个 应 用 程序 修改 过 的 数据 ,而 
这 个 数据 处 于 未 提交 状态 ,这 时 就 会 发 生 脏 读 。 第 二 个 应 用 程序 随后 会 请 求 回 滚 被 其 修改 
的 数据 ,从 而 导致 第 一 个 事务 使 用 的 数据 被 损坏 , 即 所 谓 的 “ 变 脏 ”。 在 上 面 的 例子 中 ,银行 
B 修改 余额 后 ,银行 A 再 次 获取 的 数据 为 新 数据 ,可 是 由 于 某 些 问题 后 来 银行 B 回 滚 事务 ， 
取消 了 对 余额 的 修改 , 则 银行 A 获得 了 “ 脏 数据 ”, 即 不 正确 的 数据 。 

(3) 不 可 重复 读 (Non-Repeatable Read) : 如 果 一 个 事务 获得 了 数据 ,而 该 数据 随后 被 
另 一 个 事务 所 更 改 ,那么 第 一 个 事务 无 法 再 现 前 一 次 读 取 的 数据 , 称 为 不 可 重复 读 。 在 上 例 
中 ,银行 B 修改 余额 后 ,如 果 银 行 A 只 能 获取 修改 后 的 数据 ,就 产生 了 不 可 重复 读 。 

产生 上 述 问 题 的 原因 是 破坏 了 事务 的 隔离 性 。 并 发 控制 就 是 要 用 正确 的 方法 调度 并 发 
操作 ,使 一 个 事务 的 执行 不 受 另 一 个 事务 的 干扰 ,以 避免 造成 数据 的 不 一 致 。 


2. 并 发 操作 的 调度 


计算 机 系统 对 并 行 操 作 的 调度 是 随机 的 ,而 不 同 的 调度 会 产生 不 同 的 结果 。 如 果 一 个 
事务 执行 时 ,不 允许 其 他 事务 并 发 操作 , 即 把 事务 串 行 地 执行 , 则 不 会 发 生 数 据 不 一 致 的 问 
题 。 因 此 ,可 以 得 到 结论 : 当 且 仅 当 调度 的 结果 与 串 行 执行 这 些 并 发 事务 的 结果 相同 时 ,这 
几 个 并 发 事务 的 执行 才 是 正确 的 。 这 种 并 行 调度 策略 称 为 可 串 行 化 的 调度 。 

目前 ,大 多 数 DBMS 都 采用 封锁 机 制 来 进行 并 发 控制 。 


6.3.3 封锁 


封锁 是 指使 事务 对 它 要 操作 的 数据 对 象 有 一 定 的 控制 能 力 ,是 并 发 控制 的 重要 手段 。 
封锁 有 三 个 步骤 : 第 一 步 是 申请 加 锁 , 即 事务 在 操作 前 要 对 它 使 用 的 数据 对 象 提出 加 锁 请 
求 ; 第 二 步 是 获得 锁 , 即 在 条 件 成 熟 时 ,系统 允许 事务 对 数据 加 锁 , 从 而 使 事务 获得 数据 的 
控制 权 ; 第 三 步 是 释放 锁 , 即 完成 操作 后 事务 放弃 对 数据 的 控制 权 。 为 了 达到 封锁 的 目的 ， 
在 使 用 时 事务 应 该 选择 合适 的 锁 ,并 且 要 遵从 一 定 的 封锁 协议 。 


1. 封锁 类 型 


(1) 排他 锁 

排他 锁 (Exclusive Lock ,简称 X 锁 ) 又 称 写 锁 ,是 为 修改 数据 而 保留 的 。 如 果 事 务 对 数 
据 对 象 A 加 了 X 锁 , 则 其 他 事务 就 不 能 再 对 A 加 任何 类 型 的 锁 , 直 至 事务 释放 A 上 的 X 锁 
为 止 。 这 样 ,加 了 X 锁 的 数据 对 象 A, 其 他 事务 不 能 读 取 也 不 能 修改 。 排 他 锁 是 独占 的 。 

(2) 共享 锁 
共享 锁 (Share Lock ,简称 S 锁 ) 又 称 读 锁 , 用 于 所 有 的 只 读数 据 操 作 。 如 果 事 务 T 对 数 
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据 对 象 A 加 了 S 锁 , 则 其 他 事务 也 可 以 对 A 加 S 锁 ,但 不 能 加 XX 锁 ,直至 释放 A 上 的 所 有 
S 锁 为 止 。 共 享 锁 是 非 独 占 的 ,允许 多 个 并 发 事务 读 取 其 锁定 的 数据 资源 。 


2. 封锁 粒度 


封锁 粒度 是 指 封锁 对 象 的 大 小 。 封 锁 对 象 可 以 是 逻辑 单元 ,也 可 以 是 物理 单元 。 封 锁 
的 粒度 越 大 ,系统 中 能 够 被 封锁 的 对 象 就 越 少 ,并 发 度 也 就 越 低 ,系统 开销 也 越 小 ; 相反 , 封 
锁 的 粒度 越 小 ,系统 中 能 够 被 封锁 的 对 象 就 越 多 ,并 发 度 就 越 高 ,系统 开销 也 越 大 。 

选择 封锁 粒度 要 权衡 系统 开销 和 并 发 度 。 如 果 经 常 发 生 的 并 发 操作 是 以 关系 为 单位 
的 , 则 封锁 粒度 可 以 为 关系 ; 如 果 经 常 发 生 的 并 发 操作 是 几 个 关系 , 则 封锁 粒度 可 以 为 数 
据 库 。 


3. 封锁 协议 


封锁 的 目的 是 能 够 正确 地 调度 并 发 操作 。 为 此 ,在 运用 X 锁 和 S 锁 这 两 种 基本 封锁 对 
一 定 粒度 的 数据 对 象 加 锁 时 ,还 需要 约定 一 些 规则 ,例如 何 时 加 锁 、 持 续 时 间 、 何 时 释放 等 ， 
一 般 称 这 些 规则 为 封锁 协议 。 对 封锁 方式 规定 不 同 的 规则 ,就 形成 各 种 不 同 的 封锁 协议 , 它 
们 分 别 在 不 同 的 程度 上 为 并 发 操作 的 调度 提供 一 定 的 保证 。 这 里 主要 介绍 保证 数据 一 致 性 
的 三 级 封锁 协议 和 保证 并 行 调 度 可 串 行 化 的 两 段 锁 协议 。 

(1) 保证 数据 一 致 性 的 三 级 封锁 协议 

1 级 封锁 协议 是 指 事务 在 修改 数据 之 前 必须 先 对 其 加 X 锁 , 直 到 事务 结束 才 释 放 。1 
级 封锁 协议 可 防止 " 虚 读 "产生 的 丢失 修改 ， 全 下 和 工 是 可 恢复 的 。 

2 级 封锁 协议 是 指 在 1 级 封锁 协议 的 基础 上 , 当 事 务 在 读 取 数 据 之 前 必须 先 对 其 加 S 
锁 , 读 完 后 即 可 释放 S 锁 。2 级 封锁 协议 还 可 以 进一步 防止 * 脏 读 ”。 

3 级 封锁 协议 是 指 在 1 级 封锁 协议 的 基础 上 , 当 事 务 ee 估 
S 锁 ,直到 事务 结束 才 释 放 。3 级 封锁 协议 还 可 以 进一步 防止 不 可 重复 读 ” 

(2) 保证 并 行 调度 可 串 行 化 的 两 段 锁 协议 

可 串 行 性 是 并 行 调度 正确 的 唯一 准则 ,两 段 锁 (Two-phase Locking,2PL) 协 议 是 保证 
并 行 调度 可 串 行 性 的 封锁 协议 。 

两 段 锁 协 议 规定 ,在 对 任何 数据 进行 读 、 写 操作 之 前 ,事务 首先 要 获得 对 该 数据 的 封锁 ; 
而 且 在 释放 一 个 封锁 之 后 ,事务 不 再 获得 任何 其 他 封锁 。 

“两 段 " 锁 的 含义 是 指 事务 分 为 两 个 阶段 : 获得 封锁 和 释放 封锁 。 

需要 注意 的 是 ,事务 的 两 段 锁 协议 是 可 串 行 化 调度 的 充分 条 件 ,而 不 是 必要 条 件 。 也 就 
是 说 ,只 要 遵守 两 段 锁 协议 的 调度 ,就 一 定 是 可 串 行 化 的 调度 ; 反之 ,在 可 串 行 化 的 调度 中 ， 
未 必 所 有 事务 都 遵守 两 段 锁 协议 。 


6.3.4 活 锁 与 死 锁 


1. 活 锁 


假设 事务 T1 封锁 了 某 数据 对 象 R, 事 务 T2 也 申请 封锁 R, 此 时 T2 处 于 等 待 状态 ; 可 
有 务 T1 释放 R 后 ,系统 允许 新 来 的 事务 T3 封锁 了 R,T2 仍然 处 于 等 待 状态 ; 当 事 务 
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T3 释放 有 后 ,系统 又 允许 新 来 的 事务 T4 封锁 R,T2 还 是 处 于 等 待 状态 ; ……。 事 务 T2 
有 可 能 一 直 等 待 下 去 永远 无 法 执行 ,这 就 是 活 锁 。 试 想 一 个 秘书 需要 录入 一 封 信 , 但 她 一 直 
在 忙于 接 电话 ,所 以 这 封 信永 远 都 不 会 被 录入 ,如 图 6-3 所 示 。 


Tl 
Lock R 


Lock R 


UnLock R 


图 6-3 活 锁 


解决 活 锁 的 方法 就 是 采用 先 来 先 服务 的 策略 。 当 有 多 个 事务 请 求 封锁 同一 个 数据 对 象 
R 时 ,系统 按照 申请 数据 对 象 R 的 先后 顺序 排队 ,数据 R 上 的 锁 一 旦 释放 就 允许 申请 队列 
中 第 一 个 事务 封锁 RR, 释放 封 锁 后 将 其 从 队列 中 删除 。 


2. 死 锁 


如 果 事 务 T1 封锁 了 数据 对 象 R1 ,事务 T2 封锁 了 数据 对 象 R2; 然后 事务 Tl 又 申请 
封锁 R2, 因 为 R2 已 被 T2 封锁 ,所 以 Tl 等 待 T2 释放 R2 上 的 锁 ; 接着 事务 T2 又 申请 封 
锁 R1, 因 为 R1 已 被 Tl 封锁 ,所 以 T2 等 待 T1 释放 Rl 上 


的 锁 。 这 样 就 出 现 了 事务 T1、T2 互相 等 待 的 问题 ,Tl1、T2 -一 
永远 无 法 结束 ,这 就 产生 了 死 锁 , 有 些 类 似 于 操作 系统 中 的 医 
线程 死 锁 问题 ,如 图 6-4 所 示 。 加 加 
数据 库 中 解决 死 锁 有 两 类 方法 : 其 一 是 预防 死 锁 的 发 Lock Rs 
生 , 即 采用 预防 协议 使 死 锁 状 态 永远 都 无 法 形成 其 二 是 一 i 
允许 死 锁 发 生 ,再 采用 检测 和 解决 机 制 进行 恢复 。 如 果 死 a 人 
锁 发 生 的 概率 较 高 , 则 适合 采用 预防 策略 ,否则 采用 死 锁 检 等 和 等 竺 
测 和 恢复 机 制 更 为 有 效 。 芝 加 
(1) 死 锁 的 预防 图 6-4 死 锁 
预防 死 锁 通 常 有 两 种 方法 。 
@ 一 次 封锁 法 


一 次 封锁 法 要 求 每 个 事务 必须 一 次 将 所 有 要 使 用 的 数据 对 象 全 部 封锁 ,和 否则 就 不 能 执 
行 。 事 务 Tl 同时 封锁 了 R1 和 R2 ,执行 结束 后 释放 R1 和 R2; 然后 事务 T2 再 同时 封锁 了 
R1 和 R2 ,直到 其 执行 结束 才 释 放 Rl 和 R2。 
一 次 封锁 法 能 有 效 地 防止 死 锁 的 发 生 ,但 也 存在 问题 。 其 一 是 要 一 次 性 将 以 后 用 到 的 
全 部 数据 加 锁 ,势必 扩大 了 封锁 的 范围 ,从 而 降低 了 系统 的 并 发 度 ; 其 二 是 数据 库 中 的 数据 
是 不 断 变化 的 ,原来 不 需要 加 锁 的 数据 ,在 执行 过 程 中 可 能 会 变 成 封锁 对 象 , 所 以 很 难事 先 
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精确 地 确定 每 个 事物 要 封锁 的 全 部 数据 对 象 ,只 能 扩大 封锁 范围 ,将 事务 在 运行 过 程 中 可 能 
要 封锁 的 数据 对 象 全 部 加 锁 , 这 就 进一步 降低 了 并 发 度 。 
@ 顺序 封锁 法 
顺序 封锁 法 是 预先 对 数据 对 象 规 定 一 个 封锁 顺序 ,所 有 事务 都 按 这 个 顺序 封锁 数据 对 象 。 
腿 设 数据 对 象 的 封锁 顺序 为 R1->R2, 则 事务 T1 .事务 T2 都 必须 先 封锁 R1 再 封锁 R2。 
顺序 封锁 法 也 能 够 有 效 地 防止 死 锁 的 发 生 , 但 是 维护 数据 对 象 的 封锁 顺序 是 很 麻烦 的 
情 。 因 为 数据 库 中 的 数据 是 不 断 动态 变化 的 ,而 且 事务 的 封锁 请 求 可 以 随 着 事务 的 执行 
而 动态 地 决定 ,有 时 很 难 按照 既定 的 顺序 进行 封锁 。 
由 此 可 见 ,在 操作 系统 中 普遍 采用 的 死 锁 预防 策略 并 不 是 很 适合 数据 库 系 统 的 特点 , 因 
此 ,DBMS 解决 死 锁 问题 普遍 采用 的 是 死 锁 诊断 与 解除 的 方法 。 
(2) 死 锁 的 诊断 与 解除 
诊断 死 锁 需要 使 用 事务 等 待 图 , 它 动态 地 反映 所 有 事务 的 等 待 情况 ,并 发 控制 子 系统 周 
期 性 地 检测 事务 等 待 图 ,只 要 在 图 中 出 现 回路 ,就 说 明 存在 死 锁 。 
一 旦 出 现 死 锁 就 要 设法 解除 ,通常 选择 处 理 代 价 最 小 的 事务 ,将 其 回 滚 ,释放 所 有 它 持 
有 的 封锁 ,使 其 他 事务 能 继续 执行 下 去 。 


6.4 数据 库 恢 复 


6.4.1 数据 库 恢复 概述 


在 数据 库 系统 中 ,恢复 的 基本 含义 是 恢复 数据 库 本 身 , 即 在 发 生 某 种 故障 使 数据 库 数 据 
不 再 正确 时 ,把 数据 库 恢 复 到 已 知 正确 的 某 一 状态 。 

数据 库 故障 是 指数 据 库 运 行 过 程 中 影响 数据 库 正常 使 用 的 特殊 事件 。 尽 管 数据 库 系 统 
中 采取 了 各 种 保护 措施 来 防止 数据 库 的 安全 性 和 完整 性 被 破坏 ,保证 并 发 事务 的 正确 执行 ， 
但 是 计算 机 系统 中 硬件 的 故障 、 软 件 的 错误 、 操 作 员 的 失误 以 及 恶意 的 破坏 仍 是 不 可 避免 
的 。 这 些 故 障 轻 则 造成 运行 事务 非 正 常 中 断 ,影响 数据 库 中 数据 的 正确 性 ; 重 则 破坏 数据 
库 ,使 数据 库 部 分 或 全 部 数据 丢失 。 因 此 DBMS 必须 具有 把 数据 库 从 错误 状态 恢复 到 某 一 
正确 状态 的 功能 ,这 就 是 数据 库 的 恢复 。 数 据 库 管理 系统 中 的 恢复 子 系统 是 必 不 可 少 的 , 数 
据 库 系统 所 采用 的 恢复 技术 是 否 行 之 有 效 ,不仅 对 系统 的 可 靠 程度 起 着 决定 性 的 作用 ,而 且 
对 系统 的 运行 效率 也 有 很 大 的 影响 ,是 影响 系统 性 能 的 重要 指标 。 


6.4.2 故障 的 种 类 
数据 库 系 统 中 可 能 发 生 的 故障 大 致 可 以 分 为 以 下 几 类 。 
1. 事务 故障 


事务 故障 是 指 事务 没有 达到 预期 的 终点 ,使 数据 库 可 能 处 于 不 正确 状态 。 事 务 内 部 更 
多 的 故障 是 非 预 期 的 ,是 不 能 由 应 用 程序 处 理 的 .如 运算 溢出 、 并 发 事务 发 生死 锁 而 被 选中 
撤销 该 事务 、 违 反 了 某 些 完整 性 限制 等 。 恢 复 程序 要 在 不 影响 其 他 事务 运行 的 情况 下 ,强行 
回 滚 事务 , 即 撤销 该 事务 已 经 做 出 的 任何 对 数据 库 的 修改 ,使 得 该 事务 好 像 根本 没有 启动 一 
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样 。 这 类 恢复 操作 称 为 事务 撤销 。 
2. 系统 故障 


系统 故障 是 指 造成 系统 停止 运转 的 任何 事故 ,使 得 系统 要 重新 启动 。 例 如 ,特定 类 型 的 
硬件 错误 (CPU 故障 ) .操作 系统 故障 、DBMS 代码 错误 .突然 停电 等 。 这 类 故障 影响 正在 运 
行 的 所 有 事务 ,但 不 破坏 数据 库 。 这 时 主 存 内 容 、 尤 其 是 数据 库 缓冲 区 (在 内 存 ) 中 的 内 容 都 
被 丢失 ,所 有 运行 事务 都 非 正常 终止 。 

一 方面 ,发 生 系统 故障 时 ,一 些 尚 未 完成 的 事务 的 结果 可 能 已 存 人 物理 数据 库 , 从 而 造 
成 数据 库 可 能 处 于 不 正确 的 状态 。 为 保证 数据 一 致 性 ,需要 清除 这 些 事务 对 数据 库 的 所 有 
修改 ,恢复 子 系统 必须 在 系统 重新 启动 时 让 所 有 非 正 常 终止 的 事务 回 滚 ,强行 撤销 所 有 未 完 
成 的 事务 。 另 一 方面 ,发 生 系统 故障 时 , 某 些 已 完成 的 事务 可 能 有 一 部 分 甚至 全 部 留 在 缓冲 
区 ,尚未 写 回 到 磁盘 上 的 物理 数据 库 中 ,系统 故障 使 得 这 些 事务 对 数据 库 的 修改 部 分 或 全 部 
丢失 ,这 也 会 使 数据 库 处 于 不 一 致 状态 ,应 将 这 些 事务 已 提交 的 结果 重新 写 和 数据库。 所 以 
系统 重新 启动 后 ,恢复 子 系统 除了 需要 撤销 所 有 未 完成 的 事务 外 ,还 需要 重 做 所 有 已 提交 的 
事务 ,以 将 数据 库 真正 恢复 到 一 致 状态 。 


3. 介质 故障 


介质 故障 又 称 为 硬 故障 , 指 外 存 故 障 , 如 磁盘 损坏 、 磁 头 碰撞 、 有 瞬时 强 磁场 干扰 等 。 这 类 
故障 将 破坏 整个 数据 库 或 部 分 数据 库 ,并 影响 正在 存 取 这 部 分 数据 库 的 所 有 事务 。 

发 生 介质 故障 后 ,存储 在 磁盘 上 的 数据 被 破坏 ,这 时 需要 将 发 生 介质 故障 之 前 的 后 援 副 
本 装 和 数据库 ,并 重新 做 已 成 功 完成 的 事务 ,将 事务 已 提交 的 结果 重新 记 入 数据 库 。 介 质 故 
障 发 生 的 可 能 性 很 小 ,但 破坏 性 却 是 最 大 的 ,有 时 甚至 会 导致 数据 无 法 恢复 。 


4. 计算 机 病毒 


计算 机 病毒 是 一 种 人 为 的 故障 或 破坏 , 它 像 生物 学 所 称 的 病毒 一 样 可 以 繁殖 和 传播 ,并 
造成 对 计算 机 系统 ,包括 数据 库 的 破坏 。 


6.4.3 故障 恢复 


恢复 就 是 利用 存储 在 系统 其 他 地 方 的 备份 数据 来 修复 数据 库 中 被 破坏 的 或 者 不 正确 的 
数据 。 因 此 恢复 机 制 涉 及 两 个 问题 : 一 是 建立 备份 数据 ; 二 是 如 何 利用 这 些 备份 数据 恢复 
数据 库 。 建 立 备 份 数据 最 常用 的 技术 是 数据 转 储 和 登录 日 志文 件 。 


1. 数据 转 储 


所 谓 数据 转 储 , 就 是 周期 性 地 把 数据 库 复制 到 转 储 设备 的 过 程 。 其 中 , 转 储 设备 是 指 
于 放置 数据 库 拷贝 的 磁带 或 磁盘 。 存 放 于 转 储 设备 中 的 备用 的 数据 库 文件 称 为 后 备 副 本 。 
一 旦 系统 发 生 介质 故障 ,就 可 以 使 用 后 备 副 本 来 恢复 数据 库 ,但 是 使 用 后 备 副本 恢复 的 数据 
库 只 能 恢复 到 数据 库 转 储 时 的 状态 。 

(1) 静态 转 储 和 动态 转 储 

转 储 可 以 分 为 静态 转 储 和 动态 转 储 。 
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静态 转 储 是 在 系统 中 无 运行 事务 时 进行 的 转 储 操作 , 即 转 储 操作 开始 的 时 刻 ,数据 库 处 
于 一 致 性 状态 ,而 转 储 期 间 不 允许 (或 不 存在 ) 对 数据 库 的 任何 存 取 、 修 改 活 动 。 显 然 ,静态 
转 储 得 到 的 一 定 是 一 个 数据 一 致 性 的 副本 。 
静态 转 储 十 分 简单 ,但 转 储 必须 等 待 正 在 运行 的 用 户 事务 结束 后 才能 进行 ,而 新 的 事务 
必须 等 待 转 储 结束 后 才能 执行 。 显 然 , 这 会 降低 数据 库 的 可 用 性 。 
动态 转 储 是 指 转 储 期 间 允 许 对 数据 库 进 行 存 取 或 修改 , 即 转 储 和 用 户 事务 可 以 并 发 执行 。 
动态 转 储 可 以 克服 静态 转 储 的 缺点 。 它 不 用 等 待 正在 运行 的 用 户 事务 结束 ,也 不 会 影 
响 新 事务 的 运行 。 但 是 转 储 结束 时 后 备 副 本 上 的 数据 并 不 能 保证 正确 有 效 。 为 此 ,必须 把 
转 储 期 间 各 事务 对 数据 库 的 修改 活动 登记 下 来 ,建立 日 志文 件 。 这 样 ,通过 后 备 副 本 和 日 志 
文件 就 能 把 数据 库 恢 复 到 某 一 时 刻 的 正确 状态 。 
(2) 海量 转 储 和 增 量 转 储 
转 储 还 可 以 分 为 海量 转 储 和 增 量 转 储 两 种 方式 。 
海量 转 储 是 指 每 次 都 转 储 全 部 数据 库 。 使 用 海量 转 储 得 到 的 后 备 副本 能 够 比较 方便 地 
行 数 据 库 恢 复 。 
增 量 转 储 是 指 每 次 只 转 储 上 一 次 转 储 后 更 新 过 的 数据 。 增 量 转 储 适用 于 数据 库 较 大 ， 
务 处 理 又 十 分 频繁 的 数据 库 系统 。 
由 于 数据 转 储 可 以 在 静态 和 动态 两 种 状态 下 进行 ,因此 数据 转 储 可 以 分 为 四 类 : 动态 
海量 转 储 ` 动 态 增 量 转 储 静态 海量 转 储 和 静态 增 量 转 储 , 如 表 6-3 所 示 。 


表 6-3 数据 转 储 分 类 


jl 


海量 转 储 动态 海量 转 储 静态 海量 转 储 
增 量 转 储 动态 增 量 转 储 


利用 转 储 得 到 的 后 备 副 本 恢复 数据 库 很 方便 ,只 需要 将 后 备 副 本 重新 装 和 系统 即 可 。 
但 是 , 重 装 后 备 副 本 只 能 将 数据 库 恢 复 到 转 储 时 的 状态 ,要 恢复 到 故障 发 生 时 的 状态 , 则 必 
须 重 新 运行 自转 储 以 后 的 所 有 更 新 事务 。 图 6-5 所 示 为 海量 转 储 与 恢复 的 过 程 系统 在 TT 
时 刻 停 止 运行 事务 进行 数据 转 储 , 在 Ts 时 刻 转 储 完毕 ,得 到 T。 时 刻 的 数据 库 一 致 性 的 副 
本 ,系统 运行 到 Ts 时 刻 发 生 故 障 。 为 恢复 数据 库 , 首 先 重 装 后 备 副 本 ,将 数据 库 恢 复 到 T。 
时 刻 的 状态 ,然后 重新 运行 自 T。 到 T 的 所 有 更 新 事务 ,从 而 将 数据 库 恢 复 到 故障 发 生前 
的 一 致 状态 。 


Tn 五 Ts 
让 转 储 | 运行 事务 | 
故障 发 生 点 
Tn Ln a 
重 装 后 援 副本 重新 运行 事务 | 
本 A 


图 6-5 海量 转 储 与 恢复 的 过 程 
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随 着 归档 日 志 的 堆积 ,恢复 时 间 和 对 介质 的 占用 都 会 随 之 增长 。 对 于 每 一 个 企业 ,都 有 
一 个 对 增 量 恢复 窗口 可 容忍 的 极限 。 因 此 , 增 量 备份 策略 应 该 包含 定期 的 数据 库 全 备份 ,以 
便 经 常 建立 新 的 基点 。 


2. 日 志文 件 


日 志文 件 是 用 来 记录 每 一 次 对 数据 库 更 新 活动 的 文件 。 登 记 日 志文 件 的 目的 是 为 数据 
库 的 恢复 保留 详细 的 数据 。 
(1) 日 志文 件 的 作用 
日 志文 件 可 以 用 来 进行 事务 故障 恢复 和 系统 故障 恢复 ,并 协助 后 备 副本 进行 介质 故障 
恢复 。 其 具体 作用 如 下 : 
。 事务 故障 恢复 和 系统 故障 恢复 必须 用 日 志文 件 。 
。 在 动态 转 储 方式 中 ,必须 建立 日 志文 件 ,后 备 副本 和 日 志文 件 一 起 使 用 才能 有 效 地 
恢复 数据 库 。 
。 在 静态 转 储 方式 中 ,也 可 以 建立 日 志文 件 。 当 数据 库 毁 坏 后 可 重新 装 入 后 备 副本 把 
数据 库 恢复 到 转 储 结束 时 刻 的 正确 状态 ,然后 利用 日 志文 件 ,对 已 完成 的 事务 进行 
重 做 处 理 , 对 故障 发 生 时 尚未 完成 的 事务 进行 撤销 处 理 。 
(2) 登记 日 志文 件 
每 次 修改 数据 库 时 ,都 要 登记 日 志文 件 。 日 志文 件 主要 有 两 种 格式 : 一 种 是 以 数据 块 
为 单位 的 日 志文 件 , 只 要 某 个 数据 块 中 有 数据 被 更 新 ,就 要 将 整个 块 更 新 前 、 更 新 后 的 内 容 
存 入 日 志文 件 ; 男 一 种 是 以 记录 为 单位 的 日 志文 件 ,其 中 包括 事务 的 开始 和 终止 事务 的 操 
作对 象 和 操作 类 型 .更 新 操作 的 数据 旧 值 和 新 值 等 。 
登记 日 志文 件 时 必须 遵循 以 下 原则 : 
。 严格 按 并 发 事务 执行 的 时 间 次 序 来 进行 登记 。 
。 必须 先 写 日 志文 件 ,后 写 数据 库 。 由 于 故障 可 能 发 生 在 对 数据 的 修改 写 到 数据 库 中 
和 把 表示 这 个 修改 的 日 志 记 录 写 到 日 志文 件 中 的 两 个 操作 之 间 , 如 果 先 写 了 数据 库 
修改 ,而 在 日 志 记 录 中 没有 登记 这 个 修改 , 则 以 后 就 无 法 恢复 这 个 修改 了 。 如 果 先 
写 了 日 志 , 但 没有 修改 数据 库 , 按 日 志文 件 恢复 时 只 不 过 是 多 执行 一 次 不 必要 的 撤 
销 操 作 ,并 不 会 影响 数据 库 的 正确 性 。 
(3) 恢复 事务 
发 生 故 障 时 ,首先 根据 前 次 转 储 的 后 备 副 本 恢复 数据 库 , 然 后 利用 日 志文 件 进行 恢复 
事务 。 
利用 日 志文 件 恢复 事务 主要 分 为 两 步 : 
Q@ 从 头 扫描 日 志文 件 , 找 出 哪些 事务 在 故障 发 生 时 已 经 结束 ,哪些 尚未 结束 。 
@ 对 尚未 结束 的 事务 进行 撤销 CUNDO) 处理, 对 已 经 结束 的 事务 进行 重 做 (REDO) 
处 理 。 
撤销 处 理 方法 : 反 向 扫描 日 志文 件 , 对 每 个 撤销 的 事务 的 更 新 操作 执行 反 操作 , 即 对 已 
经 插入 的 新 记录 执行 删除 ,对 已 经 删除 的 记录 执行 插入 ,恢复 修改 过 的 数据 。 
重 做 处 理 方法 : 正 向 扫描 日 志文 件 , 对 每 个 重 做 的 事务 ,重新 执行 登记 的 事务 的 操作 。 
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6.4.4 恢复 策略 


数据 库 系 统 的 恢复 包括 事务 故障 恢复 .系统 故障 恢复 和 介质 故障 恢复 。 对 于 不 同 的 故 
障 需 要 采用 不 同 的 恢复 策略 。 


1. 事务 故障 恢复 


事务 故障 是 指 事务 在 运行 至 正常 终止 点 前 被 终止 ,这 时 恢复 子 系统 应 利用 日 志文 件 撤 
销 此 事务 已 对 数据 库 进 行 的 修改 。 其 具体 步骤 如 下 : 

中 反 向 扫描 文件 日 志 ( 即 从 最 后 向 前 扫描 日 志文 件 ) ,查找 该 事务 的 更 新 操作 。 

@ 对 该 事务 的 更 新 操作 执行 逆 操 作 。 即 将 日 志 记 录 中 “更 新 前 的 值 " 写 入 数据 库 。 

。 插 入 操作 ,“ 更 新 前 的 值 "为 空 , 则 相当 于 做 删除 操作 。 

。 删除 操作 ,“ 更 新 后 的 值 ” 为 空 , 则 相当 于 做 插入 操作 。 

。 若是 修改 操作 , 则 相当 于 用 修改 前 值 代 蔡 修改 后 值 。 

@ 继续 反 向 扫描 日 志文 件 ,查找 该 事务 的 其 他 更 新 操作 ,并 进行 同样 的 处 理 。 

@ 继续 做 下 去 ,直到 读 到 该 事务 的 开始 标记 。 

如 果 在 该 事务 执行 期 间 还 有 其 他 事务 读 了 它 的 “ 废 数据 ”, 则 对 其 他 事务 也 要 进行 以 上 
的 处 理 ,这 可 能 会 进一步 引起 其 他 事务 的 重新 处 理 。 

事务 故障 的 恢复 由 系统 自动 完成 ,对 用 户 是 透明 的 ,不 需要 用 户 干预 。 


2. 系统 故障 恢复 


系统 故障 造成 数据 库 不 一 致 分 为 两 种 情况 ,一 是 未 完成 事务 对 数据 库 的 更 新 可 能 已 写 
入 数 据 库 ; 二 是 已 提交 事务 对 数据 库 的 更 新 可 能 还 留 在 缓冲 区 没有 来 得 及 写 入 数据库。 因 
此 恢复 操作 就 是 要 撤销 故障 发 生 时 未 完成 的 事务 , 重 做 已 完成 的 事务 。 

系统 恢复 的 步 又 如 下 : 

@ 正 向 扫描 日 志文 件 ( 即 从 头 扫描 日 志文 件 ) , 找 出 故障 发 生前 已 经 提交 的 事务 (这 些 
事务 以 BEGIN TRANSACTION 开始 ,以 COMMIT 结束 ) ,将 其 记 入 重 做 队列 ,并 找 出 故 
障 发 生 时 尚未 完成 的 事务 (这 些 事务 以 BEGIN TRANSACTION 开始 ,而 没有 以 COMMIT 
结束 ) ,将 其 记 入 撤销 队列 。 

@ 对 撤销 队列 中 的 各 个 事务 进行 撤销 。 进 行 撤销 的 方法 是 , 反 向 扫描 日 志文 件 ,对 每 
个 撤销 事务 的 更 新 操作 执行 逆 操 作 ,也 就 是 将 日 志 中 的 “更 新 前 的 值 " 写 人 数据 库 。 

@ 对 重 做 队列 中 的 各 个 事务 进行 重 做 处 理 。 进 行 重 做 处 理 的 方法 是 , 正 向 扫描 日 志 
文件 ,对 每 个 重 做 事务 重新 执行 日 志文 件 登 记 的 操作 ,将 日 志 中 的 “更 新 后 的 值 * 写 入 数 
据 库 。 

系统 故障 的 恢复 由 系统 自动 完成 ,不 需要 用 户 干预 。 


3. 介质 故障 恢复 


发 生 介质 故障 后 ,磁盘 上 的 物理 数据 和 日 志文 件 都 被 破坏 。 恢 复 的 方法 是 重 装 数据 库 ， 
并 重 做 已 完成 的 事务 。 具 体 做 法 如 下 : 
吕 装 和 最 新 的 数据 库 副 本 ( 离 故 障 发 生 时 刻 最 近 的 转 储 副本 ) ,使 数据 恢复 到 最 近 一 次 
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转 储 时 的 一 致 性 状态 ,对 于 动态 转 储 的 数据 库 副本 ,还 需要 同时 装 入 转 储 开始 时 刻 的 日 志文 
件 副本 ,利用 系统 故障 恢复 方法 ( 即 REDO 二 UNDO) ,将 数据 库 恢 复 到 一 致 性 状态 。 对 于 静 
态 转 储 的 数据 库 副本 , 装 入 后 数据 库 即 处 于 一 致 性 状态 。 对 于 动态 转 储 的 数据 库 副 本 ,还 要 
进行 第 @ 步 。 

@ 装 入 相应 的 日 志文 件 副 本 , 重 做 已 完成 的 事务 。 首 先 扫 描 故障 发 生 时 已 提交 的 事务 
标识 ,将 其 记 入 重 做 队列 ,然后 正 向 扫描 日 志文 件 ,对 重 做 队列 中 的 所 有 事务 进行 重 做 处 理 ， 
也 就 是 将 日 志 中 的 “更 新 后 的 值 * 写 入 数据 库 。 

介质 故障 的 恢复 需要 DBA 介入 ,但 是 DBA 只 需要 重 装 最 近 转 储 的 数据 库 副本 和 有 
关 的 各 日 志文 件 副本 ,然后 执行 系统 提供 的 恢复 命令 即 可 ,具体 的 恢复 操作 仍 由 DBMS 
完成 。 

对 于 因为 计算 机 病毒 发 生 故 障 的 数据 库 ,要 视 具 体 情 况 而 定 , 大 多数 都 可 以 按照 介质 故 
障 或 系统 故障 恢复 。 


6.5 本 章 小 结 


DBMS 是 管理 数据 的 核心 ,其 自身 必须 提供 统一 的 数据 保护 功能 以 确保 数据 库 的 安全 
可 靠 和 正确 有 效 。 本 章 介绍 了 数据 库 的 安全 性 、 完 整 性 .并 发 控制 和 恢复 四 个 方面 的 基本 概 

数据 库 的 安全 性 是 指 保护 数据 库 , 防 止 用 户 不 合法 使 用 所 造成 的 数据 泄露 .修改 或 破 
坏 。 数 据 库 的 安全 性 可 以 通过 用 户 标识 与 鉴别 . 存 取 控 制 (自主 存 取 控制 和 强制 存 取 控 制 )、 
视图 机 制 . 审 计 和 数据 加 密 等 来 实现 。 

数据 库 的 完整 性 是 指 保证 数据 库 数据 的 正确 性 有 效 性 和 相 容 性 ,防止 错误 的 数据 进入 
数据 库 。 完 整 性 可 以 用 完整 性 约束 来 表示 。 

数据 库 的 并 发 控制 以 事务 为 单位 ,通常 使 用 封锁 技术 实现 并 发 控制 。 本 章 介绍 了 两 类 
最 常用 的 封锁 : 三 级 封锁 协议 和 两 段 锁 协议 。 三 级 封锁 协议 用 于 保证 数据 的 一 致 性 ; 可 串 
行 性 是 并 行 调度 正确 的 唯一 准则 ,两 段 锁 协 议 是 保证 并 行 调度 可 串 行 性 的 封锁 协议 。 对 数 
据 对 象 实施 封锁 ,会 带 来 活 锁 和 死 锁 问 题 ,并 发 控制 机 制 必须 提供 适合 数据 库 特 点 的 解决 
方法 。 

数据 库 系统 中 可 能 发 生 的 故障 大 致 可 以 分 为 事务 故障 、 系 统 故障 、 介 质 故 障 和 计算 机 病 
毒 几 类 。DBMS 必须 具有 把 数据 库 从 错误 状态 恢复 到 已 知 正确 的 某 一 状态 的 功能 。 数 据 
转 储 和 登记 日 志文 件 是 数据 库 恢 复 中 最 常用 的 技术 。 


(6.6 习题 


6.6.1 名 词 解 释 


事务 .数据库 的 安全 性 ,封锁 共享 锁 ,排他 锁 、 活 锁 、 死 锁 、 封 锁 粒 度 、 封 锁 协 议 , 日 志文 
件 、 事 务 故障 、 系 统 故 障 、 介 质 故 障 、 计 算 机 病毒 
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O) 


.6.2 简 答题 


. 简 述 实现 数据 库 安 全 性 控制 的 常用 方法 和 技术 。 
. 数据 库 的 完整 性 和 安全 性 概念 有 什么 区 别 和 联系 ? 
. 数据 库 的 完整 性 约束 条 件 可 以 分 为 哪 几 类 ? 
试 述 事务 的 概念 和 四 个 属性 。 

. 数据 库 的 并 发 操作 会 带 来 哪些 问题 ? 如何 解 决 ? 
. 简 述 两 种 基本 的 封锁 类 型 的 含义 。 

. 简 述 两 段 锁 协 议 的 含义 。 

. 简 述 保证 数据 一 致 性 的 三 级 封锁 协议 。 

. 活 锁 是 如 何 产生 的 ? 解决 活 锁 的 方法 是 什么 ? 
. 什么 是 死 锁 ? 避免 死 锁 的 方法 有 哪些 ? 

. 数据 库 运行 中 可 能 产生 的 故障 有 哪 几 类 ? 

12. 数据 库 恢 复 的 具体 实现 方法 有 哪些 ? 

13， 简 述 数据 库 转 储 的 含义 和 分 类 。 

14. 日 志文 件 的 作用 是 什么 ? 

15. 如 何 利 用 日 志文 件 恢复 事务 ? 

16. 简 述 登记 日 志文 件 时 必须 遵循 的 原则 。 

17. 简 述 事务 故障 及 其 恢复 策略 。 

18. 简 述 系统 故障 及 其 恢复 策略 。 

19. 简 述 介质 故障 及 其 恢复 策略 。 


6.6.3 综合 题 
试 述 某 一 个 实际 的 DBMS 产品 中 采用 的 恢复 策略 。 


DOT 楼- 


jk js 
一 So 


现代 信息 系统 总 是 以 一 个 数据 库 作 为 其 核心 和 基础 。 因 此 ,数据 库 的 建立 与 使 用 水 平 
代表 着 社会 信息 化 建设 的 程度 。 设 计 一 个 数据 库 尤 其 是 大 型 数据 库 是 一 项 十 分 复杂 而 费时 
的 工作 , 它 不 但 要 使 用 数据 库 和 数据 处 理 理论 与 技术 ,还 涉及 许多 其 他 领域 的 知识 ,如 管理 
科学 、 系 统 工程 ,当然 还 有 计算 机 科学 的 许多 相关 领域 。 


Ci 数据 库 设计 概述 


数据 库 设计 的 目的 就 是 实现 数据 库 应 用 ,所 以 它 与 数据 库 应 用 系统 ( 即 各 种 信息 系统 ) 
的 设计 紧密 相关 ,但 二 者 又 不 完全 相同 。 数 据 库 设计 者 基于 用 户 的 各 种 应 用 需求 (包括 数据 
需求 和 处 理 需 求 ) ,选择 适当 的 系统 环境 (硬件 配置 .操作 系统 和 DBMS 等 )、 使 用 合理 的 设 
计 方法 与 技术 来 建立 一 个 数据 库 以 满足 用 户 需 要 的 过 程 称 为 数据 库 设 计 。 为 此 ,首先 要 明 
确 数据 库 设计 要 考虑 和 解决 的 主要 问题 。 

7.1.1 数据 库 设 计 的 内 容 

数据 库 设计 的 内 容 主 要 包括 数据 库 的 结构 特性 设计 数据库 的 行为 特性 设计 数据库 的 
物理 模式 设计 。 其 中 ,数据 库 的 结构 特性 设计 起 着 关键 作用 ,行为 特性 设计 起 着 辅助 作用 。 

1. 数据 库 的 结构 特性 设计 

数据 库 的 结构 特性 设计 是 指数 据 库 结构 的 设计 ,设计 结果 能 否 得 到 一 个 合理 的 数据 模 
型 ,是 数据 库 设计 的 关键 。 由 于 数据 库 的 结构 特性 是 静态 的 ,一 般 情况 下 不 会 轻易 变动 ,所 
以 数据 库 的 结构 特性 设计 又 称 为 数据 库 的 静态 结构 设计 。 首 先 要 将 现实 世界 中 的 事物 以 及 
事物 间 的 联系 用 E-R 图 表示 出 来 .再 对 各 个 分 E-R 图 进行 汇总 ,得 出 数据 库 的 概念 结构 模 


型 ,然后 将 概念 结构 模型 转化 为 数据 库 的 逻辑 结构 模型 表示 ,最 后 进行 数据 库 物 理 设计 ,并 
建立 数据 库 。 


2. 数据 库 的 行为 特性 设计 


数据 库 的 行为 特性 设计 是 指 应 用 程序 、 事 务 处 理 的 设计 。 数 据 库 的 行为 特性 设计 是 基 
于 数据 库 用 户 的 行为 和 动作 进行 设计 ,而 用 户 行为 总 是 更 新 数据 库 内 容 的 操作 ,用 户 行为 特 
性 是 动态 的 ,所 以 数据 库 的 行为 特性 设计 又 称 为 数据 库 的 动态 特性 设计 。 首 先 要 将 现实 世 
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界 中 的 数据 用 数据 流程 图 和 数据 字典 表示 ,并 详细 描述 其 中 的 数据 操作 要 求 ,进而 得 出 系统 
的 功能 模块 结构 和 数据 库 的 子 模式 。 


3. 数据 库 的 物理 模式 设计 


数据 库 的 物理 模式 设计 要 求 是 : 根据 库 结构 的 动态 特性 ( 即 数据 库 应 用 处 理 要 求 ) ,在 
选 定 的 DBMS 环境 下 ,把 数据 库 的 逻辑 结构 模型 加 以 物理 实现 ,从 而 得 出 数据 库 的 存储 模 
式 和 存 取 方法 。 

在 数据 库 设 计 中 ,通常 将 结构 特性 设计 和 行为 特性 设计 结合 起 来 ,相互 参照 ,同步 进行 ， 
才能 较 好 地 达到 设计 目标 。 数 据 库 设计 者 在 进行 设计 时 ,应 考虑 到 计算 机 的 硬件 环境 和 软 
件 环境 ,考虑 到 当前 以 及 未 来 时 间 段 内 对 系统 的 需求 ,所 设计 的 系统 既 能 满足 用 户 的 近期 需 
求 , 同 时 对 远 期 的 数据 需求 也 具有 相应 的 处 理 方 案 。 也 就 是 说 ,数据 库 设 计 者 应 充分 考虑 到 
系统 可 能 的 扩充 和 改动 ,使 系统 具有 较 长 的 生命 周期 。 


7.1.2 数据 库 设计 的 方法 


早期 的 数据 库 设 计 采 用 手工 试 凑 法 进行 ,使 用 手工 试 次 法 设计 数据 库 与 设计 人 员 的 经 
验 和 水 平 有 直接 关系 , 它 更 像 是 一 种 技艺 而 不 是 工程 技术 。 这 种 方法 缺乏 科学 的 理论 和 工 
程 方 法 支持 ,数据 库 设 计 的 质量 很 难得 到 保证 ,数据 库 常 常 是 在 投入 使 用 以 后 才 发 现 问 题 ， 
因而 不 得 不 进行 修改 ,这 样 就 增加 了 系统 维护 的 代价 。 随 着 计算 机 技术 的 飞速 发 展 , 人 们 也 
在 不 断 努 力 探索 各 种 非 手工 的 数据 库 设计 方法 ,并 提出 了 多 种 数据 库 设 计 的 准则 和 规范 ,这 
些 设 计 方 法 被 称 为 规范 设计 法 。 

非 手 工 方法 的 主要 代表 有 基于 LRA 方法 .New Orleans 方法 、E-R 模型 方法 等 。 其 中 
New Orleans 方法 即 新 奥尔良 法 ,是 规范 设计 中 比较 著名 的 一 种 方法 。 它 将 数据 库 设计 分 
为 4 个 阶段 : 需求 分 析 、 概 念 设计 、 逻 辑 设 计 和 物理 设计 。 其 后 ,许多 科学 家 对 此 进行 了 改 
进 , 把 数据 库 设 计 分 为 6 个 阶段 进行 ,分 别 是 需求 分 析 、 概 念 结构 设计 、 逻 辑 结构 设 计 、 物 理 
结构 设计 数据库 实施 和 数据 库 的 运行 与 维护 。 本 章节 中 所 介绍 的 数据 库 设计 的 基本 步骤 
正 是 按照 新 奥尔良 法 所 提出 的 数据 库 设 计 的 6 个 阶段 进行 操作 的 。 

数据 库 工作 者 们 十 几 年 来 一 直 致 力 于 研究 和 开发 数据 库 设 计 工具 ,目前 已 经 具有 一 些 
比较 成 熟 的 数据 库 设计 工具 软件 ,从 而 减轻 数据 库 设 计 人 员 的 工作 量 ,辅助 他 们 更 好 地 完成 
设计 任务 ,特别 是 大 型 数据 库 的 设计 更 需要 自动 设计 工具 的 支持 。 


7.1.3 数据库 设计 的 步骤 
目前 的 数据 库 设计 大 多 分 6 个 阶段 进行 (如 图 7-1 所 示 )。 


1. 需求 分 析 阶 段 


需求 分 析 阶 段 是 数据 库 设计 的 第 一 步 , 它 是 后 继 各 阶段 的 基础 ,也 是 最 困难 、 最 耗 时 的 
一 步 。 需 求 分 析 就 是 要 准确 了 解 并 分 析 用 户 对 系统 的 需求 ,并 根据 用 户 要 求 明确 系统 要 达 
到 的 目标 和 要 实现 的 功能 。 在 分 析 设 计 阶 段 初期 ,用户 可 能 会 在 原 有 基础 上 提出 一 些 新 的 
要 求 , 设 计 者 就 要 在 需求 分 析 阶 段 进行 改善 和 完善 ,最 大 限度 地 满足 用 户 需求 。 需 求 分 析 是 
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否 准 确 和 完善 ,直接 影响 整个 数据 库 系 统 的 性 能 。 
需求 分 析 2. 概念 结构 设计 阶段 


设计 局 部 E-R 图 


这 一 阶段 可 以 说 是 整个 数据 库 设 计 的 关键 。 设 计 者 通过 


1 


设计 全 局 E-R 图 


全 局 E-R 模 型 的 优化 


逻辑 结构 设计 | 


E-R 图 转换 为 数据 模型 


关系 规范 化 


数据 模型 的 优化 


设计 外 模式 


物理 结构 设计 二 


物理 结构 设计 


对 用 户 需求 进行 归纳 与 抽象 ,形成 一 个 与 计算 机 硬件 无 关 并 
独立 于 数据 库 管 理 系 统 的 概念 模型 。 


3. 逻辑 结构 设计 阶段 


逻辑 结构 设计 阶段 是 将 概念 结构 转换 为 具体 数据 库 管 理 
系统 所 支持 的 数据 模型 ,并 对 数据 模型 进行 优化 。 


4. 物理 结构 设计 阶段 


物理 结构 设计 阶段 是 为 逻辑 设计 模型 选取 一 个 适合 应 
环境 的 数据 存储 结构 和 存 取 方法 ,并 评价 设计 ,对 系统 性 能 进 
行 预 测 。 

5. 数据 库 实 施 阶段 

在 数据 库 实施 阶段 中 ,系统 设计 人 员 要 根据 数据 库 逻 辑 
设计 和 物理 设计 结果 编制 与 调试 应 用 程序 、 装 入 数据 ,并 进行 


1 数据 库 系统 试 运行 。 
评价 物理 结 
6. 数据 库 运行 和 维护 阶段 


数据 库 实施 数据 库 应 用 系统 在 试 运行 结果 满意 的 情况 下 ,可 投入 正 
式 运行 。 在 系统 运行 过 程 中 ,必须 不 断 地 对 其 结构 和 性 能 进 
行 评 价 、 修 正 与 完善 ,解决 开发 过 程 中 遗留 的 问题 ,延长 数据 
库 系统 的 生命 周期 。 
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图 7-1 数据 库 设计 的 步骤 


0.2 需求 分 析 


需求 分 析 就 是 调查 ,收集 ,分 析 、 最 后 定义 用 户 对 数据 库 的 各 种 要 求 。 它 是 整个 数据 库 
设计 的 基础 和 出 发 点 ,其 结果 将 直接 影响 后 面 各 步 的 设计 ,甚至 决定 着 最 终 设计 的 数据 库 的 
好 坏 与 成 败 。 为 此 ,首先 必须 知道 需求 分 析 的 任务 是 什么 ,以 及 采用 什么 样 的 方法 进行 需求 
分 析 。 


7.2.1 需求 分 析 的 任务 


需求 分 析 的 主要 任务 是 详细 调查 现实 世界 的 组 织 机构 情 况 , 充 分 了 解 系统 概况 和 发 展 
前 景 ,明确 用 户 的 各 种 需求 ,收集 支持 系统 目标 的 基础 数据 及 其 处 理 方法 ,确定 新 系统 的 功 
能 和 边界 。 
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调查 是 需求 分 析 的 重要 手段 ,只 有 通过 对 用 户 的 调查 研究 ,才能 获取 数据 库 系统 所 需要 
的 数据 情况 和 数据 处 理 要 求 。 调 查 的 具体 内 容 包 括 以 下 三 个 方面 。 
1. 数据 库 信息 内 容 


信息 需求 定义 了 未 来 系统 用 到 的 所 有 信息 ,描述 了 数据 之 间 本 质 上 和 概念 上 的 联系 , 描 
述 了 实体 、 属 性 、 组 合 及 联系 的 性 质 。 


2. 数据 处 理 内 容 


数据 处 理 需 求 中 定义 了 用 户 要 完成 的 数据 处 理 的 操作 ,描述 了 操作 的 优先 次 序 、 响 应 时 
间 及 数据 处 理 的 工作 方式 。 


3. 数据 安全 性 和 完整 性 要 求 


要 求 定义 数据 的 保密 措施 和 存 取 控 制 要 求 ,以 及 数据 或 数据 间 的 约束 限制 。 

7.2.2 需求 分 析 的 步骤 和 方法 

实际 上 ,确定 用 户 的 最 终 需 求 是 一 件 非常 困难 的 事情 。 因 为 一 方面 用 户 缺少 计算 机 专 
业 知识 ,不 知道 计算 机 能 做 什么 不 能 做 什么 ,因而 不 能 准确 地 表达 自己 的 需求 ; 另 一 方面 ， 
设计 人 员 缺 少 用 户 的 专业 知识 ,不 易 理 解 用 户 的 真正 需求 ,甚至 可 能 会 误解 用 户 的 需求 。 只 
有 设计 人 员 与 用 户 加 强 交流 ,互相 沟通 ,才能 较 好 地 完成 需求 分 析 。 进 行 需求 分 析 主要 包括 
以 下 几 个 步骤 。 

1. 分 析 用 户 活动 ,产生 用 户 活动 图 

这 一 步 主 要 是 了 解 现实 社会 的 机 构 组 织 及 用 户 当 前 的 业务 活动 情况 , 搞 清楚 其 业务 流 
程 ,对 一 个 比较 复杂 的 处 理 ,可 划分 为 若干 子 处 理 , 进 行 分 析 之 后 夯 出 用 户 活动 图 。 


2. 确定 系统 范围 ,产生 系统 范围 图 


这 一 步 主要 是 确定 系统 的 边界 。 明 确 哪些 功能 由 人 工 完 成 ,哪些 功能 由 计算 机 实现 。 
由 计算 机 完成 的 功能 就 是 新 系统 应 该 实现 的 功能 。 


3. 分 析 用 户 活动 涉及 的 数据 .产生 数据 流 图 


这 一 步 主 要 是 深入 分 析 用 户 的 业务 处 理 , 以 数据 流 图 的 形式 表示 出 数据 的 流向 和 对 数 
据 所 进行 的 加 工 。 


4. 分 析 系 统 数据 ,产生 数据 字典 


数据 流 图 仅仅 表示 出 系统 由 哪 几 部 分 组 成 和 各 部 分 之 间 的 关系 ,并 没有 说 明 各 个 成 分 
的 含义 。 只 有 对 每 个 成 分 都 给 出 确切 定义 后 ,才能 完整 地 描述 系统 。 

常用 的 调查 方法 有 跟班 作业 ,专家 咨询 、 开 调查 会 .请 用 户 填写 调查 表 查阅 相关 数据 记 
录 等 。 

调查 了 解 了 用 户 的 需求 以 后 ,需要 进一步 分 析 和 表达 用 户 的 需求 。 分 析 和 表达 用 户 需 
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求 的 方法 很 多 ,常用 的 是 结构 化 分 析 方 法 (Structure Analysis, SA 方法 ), 它 是 一 种 简单 实 
的 方法 。SA 方法 从 最 上 层 的 系统 组 织 结构 入 手 , 采 用 自 项 向 下 、 逐 层 分 解 的 方式 分 析 
系统 。 


7.2.3 需求 分 析 注意 的 问题 


需求 分 析 是 后 面 各 个 阶段 设计 的 基础 ,关系 到 系统 的 设计 是 否 合理 和 实用 。 这 里 要 强 
调 以 下 两 点 需 注意 的 问题 : 

(1) 需求 分 析 阶段 一 定 要 收集 未 来 应 用 所 涉及 的 数据 。 如 果 数 据 库 设计 人 员 仅 仅 按照 
当前 应 用 来 设计 ,新 数据 的 加 入 就 会 在 操作 中 显得 十 分 困难 ,不 仅 会 影响 数据 库 的 概念 结 
构 ,而 且 将 影响 逻辑 结构 和 物理 结构 。 所 以 设计 人 员 必 须 有 前 瞻 性 ,充分 考虑 到 未 来 应 用 可 
能 发 生 的 扩充 和 改变 ,使 设计 易于 变动 。 

(2) 需求 分 析 离 不 开 用 户 的 积极 参与 。 由 于 用 户 缺 少 计算 机 专业 知识 ,有 时 不 能 准确 
表达 自己 的 要 求 ; 而 设计 人 员 缺 少 用 户 的 专业 知识 ,不 易 理 解 用 户 的 真正 需求 ,这 就 导致 确 
定 用 户 最 终 需 求 成 为 一 件 非常 困难 的 事情 。 只 有 设计 人 员 与 用 户 加 强 沟通 ,互相 交流 ,及 时 
反馈 用 户 意见 ,才能 够 较 好 地 完成 需求 分 析 。 因 此 ,用 户 的 积极 参与 是 数据 库 设 计 中 不 可 缺 
少 的 环节 。 


C3 概念 结构 设计 


在 需求 分 析 阶 段 ,数据 库 设 计 人 员 充 分 调查 并 描述 了 用 户 的 应 用 需求 ,但 这 些 应 用 需求 
还 是 现实 世界 的 具体 需求 ,应 该 首先 把 它们 抽象 为 信息 世界 的 结构 ,这 样 才能 更 好 地 ,更 准 
确 地 用 某 一 个 DBMS 实现 用 户 的 这 些 需 求 。 将 系统 需求 分 析 得 到 的 用 户 需 求 抽象 为 信息 
结构 的 过 程 就 是 概念 结构 设计 。 它 的 目标 是 产生 反映 企业 各 组 织 信息 需求 的 数据 库 概 念 结 
构 , 即 概念 模型 。 

概念 结构 独立 于 数据 库 多 辑 结构 , 也 独立 于 支持 数据 库 的 DBMS。 它 是 现实 世界 与 机 
器 世界 的 中 介 , 它 能 够 充分 反映 现实 世界 ,包括 实体 与 实体 之 间 的 联系 ,同时 又 易于 向 关系 、 
网 状 . 层 次 等 各 种 数据 模型 转换 。 它 是 现实 世界 的 一 个 真实 模型 ,易于 理解 ,便于 和 不 熟悉 
计算 机 的 用 户 交换 意见 ,使 用 户 易于 参与 , 当 现 实 世界 需求 改变 时 ,概念 结构 又 可 以 很 容易 
地 做 相应 的 调整 。 因 此 概念 结构 设计 是 整个 数据 库 设 计 的 关键 所 在 。 


7.3.1 概念 结构 设计 的 方法 与 步骤 


概念 模型 是 数据 模型 的 前 身 , 它 比 数据 模型 更 独立 ,更 抽象 ,也 更 稳定 。 设 计 概 念 结构 
的 策略 主要 有 以 下 几 种 : 

(1) 自 项 向 下 : 首先 定义 全 局 概念 结构 框架 ,然后 逐步 细 化 为 完整 的 全 局 概念 结构 。 

(2) 自 底 向 上 : 首先 定义 每 一 局 部 应 用 的 概念 结构 ,然后 按 一 定 的 规则 把 它们 集成 起 
来 ,从 而 得 到 全 局 概念 结构 。 

(3) 逐步 扩张 : 首先 定义 最 重要 的 那些 核心 概念 结构 ,再 逐渐 向 外 扩充 生成 其 他 概念 
结构 ,直至 完成 总 体 概念 结构 。 
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(4) 混合 策略 : 混合 策略 是 把 自 顶 向 下 和 自 底 向 上 结合 起 来 的 方法 , 它 先 采用 自 顶 向 
下 的 策略 设计 一 个 全 局 概念 结构 的 框架 ,然后 以 它 为 骨架 ,再 自 底 向 上 设计 局 部 概念 结构 ， 
并 把 它们 集成 起 来 。 

其 中 最 常用 的 策略 是 自 底 向 上 设计 策略 ,其 数据 库 概 念 设计 的 主要 步骤 如 下 : 
@ 进行 数据 抽象 ,设计 局 部 概念 模式 。 局 部 用 户 的 信息 需求 是 构建 全 局 概念 模式 的 基 
础 。 因 此 ,首先 要 根据 用 户 的 需求 为 其 建立 相应 的 局 部 概念 结构 。 

@ 将 局 部 概念 模式 综合 成 全 局 概念 模式 。 在 对 局 部 概念 模式 进行 综合 的 过 程 中 ,主要 
解决 各 局 部 模式 对 各 种 对 象 定义 不 一 致 的 问题 。 把 各 个 局 部 结构 合并 ,还 会 产生 宛 余 问 题 ， 
或 导致 对 信息 需求 的 再 调整 与 分 析 , 以 确定 确切 的 含义 。 

@ 进行 评审 改进 。 消 除了 所 有 冲突 后 ,就 可 以 把 全 局 概念 结构 提交 评审 。 评 审 分 为 
用 户 评审 和 系统 开发 人 员 评 审 。 前 者 的 重点 在 于 确认 全 局 概念 模式 是 否 完整 准确 地 反映 了 
用 户 信 息 需求 ; 而 后 者 则 侧重 于 确认 全 局 结构 是 否 完整 成 分 划分 是 否 合理 ,是 否 存 在 不 一 
致 性 等 。 如 果 在 评审 中 发 现 问题 ,应 及 时 改进 。 


7.3.2 数据 抽象 


进行 数据 抽象 是 概念 设计 的 第 一 步 。 所 谓 抽象 是 对 现实 世界 中 的 人 、 事 、 物 的 人 为 处 
理 ,抽取 人 们 关心 的 共同 特性 ,忽略 非 本 质 的 细节 ,并 把 这 些 特性 用 各 种 概念 精确 地 加 以 描 
述 , 形 成 某 种 模型 。 

抽象 有 两 种 形式 ,一 种 是 系统 状态 的 抽象 , 即 抽象 对 象 ; 另 一 种 是 系统 转换 的 抽象 , 即 
抽象 运算 。 在 数据 库 设计 中 ,概念 设计 的 目的 就 是 要 定义 抽象 对 象 的 关系 结构 。 

数据 抽象 的 三 种 基本 方法 是 分 类 、 聚 集 和 概括 。 利 用 数据 抽象 方法 可 以 对 现实 世界 进 
行 抽象 ,得 出 概念 模型 的 实体 集 和 属性 。 


1. 分 类 


所 谓 分 类 就 是 定义 某 一 概念 作为 现实 世界 中 一 组 成 员 的 类 型 ,这 些 对 象 具 有 某 些 共同 
的 特性 和 行为 ,分 类 抽象 了 对 象 值 和 型 之 间 的 “成 员 ” 的 语义 。 在 E-R 模型 中 实体 集 就 是 这 
种 抽象 。 例 如 ,在 学 校 里 , 王 老 师 是 一 名 教师 ,他 具有 教师 们 共同 的 特性 和 行为 : 隶属 于 某 
教学 系 部 ,承担 某 门 课程 的 教学 任务 。 与 王 老 师 属 同一 对 象 的 还 有 张 老 师 , 李 老师 等 其 他 教 
师 , 如 图 7-2 所 示 。 


2. 聚集 


聚集 的 数学 意义 就 是 笛 卡 儿 积 的 概念 。 通 过 聚集 ,形成 对 象 之 间 的 一 个 联系 对 象 ,抽象 
了 对 象 内 部 类 型 和 对 象 内 部 组 成 部 分 的 语义 。 属 性 的 聚集 组 成 了 实体 型 。 例 如 把 实体 集 
“教工 ?的 “教工 号 "“ 姓 名 ”“ 性 别 等 属性 聚集 在 一 起 ,形成 实体 型 “教工 ”, 如 图 7-3 所 示 。 


教工 教工 一 一 一 实体 型 


一 | 村 enn 
王 老 师 。” 张 老师 。… 地 老师 i 


图 7-2 分 类 图 7-3 教工 属性 聚集 实例 
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概括 是 从 一 类 对 象形 成 一 个 对 象 类 型 。 例 如 一 类 对 象 { 汽 车 ,摩托 车 ,自行 车 ,…} 可 以 
概括 为 一 个 对 象 类 型 “公路 车 辆 ”, 可 以 把 公路 车 辆 称 为 超 类 ,把 汽车 等 称 为 子 类 ,如 图 7-4 
所 示 。 概 括 的 一 个 重要 性 质 是 继承 性 。 继 承 性 指 子 类 继承 超 类 的 所 有 抽象 。 

超 类 


公路 车 辆 
| 

了 类 一 汽车 摩托 车 自行 车 
图 74 概括 


7.3.3 采用 E-R 方 法 的 数据 库 概 念 结构 设计 


概念 设计 方法 最 著名 、 最 实用 的 是 P. P. S. Chen 于 1976 年 提出 的 “实体 -联系 法 ” 
(Entity-Relationship Approach ,简称 E-R 方法 ) 。 这 种 方法 将 现实 世界 的 信息 结构 统 
属性 ,实体 以 及 实体 之 间 的 联系 , 即 E-R 图 来 描述 。 

1. 设计 局 部 E-R 模型 

通常 ,一 个 数据 库 系 统 都 是 为 多 个 不 同 用 户 服务 的 。 信 息 处 理 需 求 也 会 因为 用 户 观点 
的 不 同 而 有 所 差异 。 在 设计 数据 库 概 念 结构 时 ,一 个 有 效 的 策略 就 是 先 分 别 考虑 各 个 用 户 
的 信息 需求 ,形成 局 部 概念 结构 ,然后 再 综合 成 全 局 结构 。 

局 部 E-R 模型 设计 步骤 如 图 7-5 所 示 。 


首先 ,确定 局 部 结构 的 范围 划分 。 划 分 的 方式 一 般 有 两 种 : 一 ry 


种 是 依据 系统 的 当前 用 户 进行 自然 划分 , 另 一 种 是 按 用 户 要 求 数据 
库 提供 的 服务 归纳 成 几 类 ,使 每 一 类 应 用 访问 的 数据 显著 不 同 于 其 
他 类 ,然后 为 每 类 应 用 设计 一 个 局 部 模型 。 局 部 结构 范围 的 划分 要 
自然 且 易 于 管理 ,范围 之 间 的 界面 要 清晰 ,彼此 之 间 的 相互 影响 要 
同时 应 注 活 度 定义 属性 ,定义 实体 ， 
小 ,同时 应 注意 范围 的 大 小 要 适度 。 闪光 周 必定 交 实 人 
接 下 来 要 标定 实体 ,实体 间 的 联系 以 及 实体 的 属性 。 它 们 通常 
是 按照 对 客观 世界 的 理解 和 思维 习惯 ,根据 数据 的 逻辑 关系 来 划 
分 的 。 
划分 实体 和 属性 的 基本 准则 要 注意 以 下 几 点 : 
属性 与 它 所 描述 的 实体 之 间 只 能 是 单 值 联系 , 即 联系 只 能 是 。 进入 设计 全 局 ER 图 


确定 局 部 结构 视图 


一 对 多 的 。 图 75 局 部 ER 图 
。 属性 不 能 再 有 需要 进一步 描述 的 性 质 。 设计 步 又 
。 作为 属性 的 数据 项 ,除了 它 所 描述 的 实体 之 外 ,不 能 再 与 其 

他 实体 具有 联系 。 


能 作为 属性 的 数据 应 尽量 作为 属性 处 理 。 


【 例 7. 1】 以 仓库 管理 为 例 , 描 述 设计 ER 图 的 步骤 。 


步骤 如 下 : 
@ 确定 实体 类 型 
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本 例 中 有 项 目 PROJECT、 零 件 PART 和 零件 供应 商 SUPPLIER 三 个 实体 类 型 。 


@ 确定 联系 类 型 
PROJECT 和 PAR 
于 多 个 项 目 中 。PART 


@ 根据 实体 类 型 和 联系 类 型 画 出 E-R 图 (如 图 7-6 所 示 )。 


TT 之 间 是 mm: 


nn 联系 , 即 一 个 项 目 需要 使 用 多 种 零件 ,一 个 零件 可 


和 SUPPLIER 之 间 也 是 m:n 联系 , 即 一 种 零件 可 由 多 个 供应 商 提 
供 , 一 个 供应 商 也 可 提供 多 种 零件 。 分 别 定 义 联系 类 型 为 P-P 和 P-S。 
@ 确定 实体 类 型 的 属性 
实体 类 型 PROJECT 有 属性 : 项 目 符号 J# \ 项 目 名 称 JNAME ,项 目 开 工 日 期 DATE; 
实体 类 型 PART 有 属性 : 零件 编号 P# 、 零 件 名 称 PNAME ,颜色 COLOR ,重量 WEIGHT; 
实体 类 型 SUPPLIER 有 属性 : 供应 商 编号 S# 、 供 应 商 名 SNAME ,供应 商 地 址 SADR。 
@ 确定 联系 类 型 的 属性 
联系 类 型 应 该 至 少 包括 与 之 联系 的 所 有 实体 类 型 的 键 , 例 如 联系 类 型 PP 有 属性 : 需 
要 的 零件 数量 TOTAL:; 联系 类 型 P-S 有 属性 : 供应 数量 QUANTITY 。 


PROJECT 


ee 


图 7-6 仓库 ER 图 


2. 设计 全 局 E-R 模型 


这 一 步 是 将 所 有 局 


部 的 ER 图 集成 为 全 局 的 E-R 图 , 即 


全 局 的 概念 模型 。 设 计 全 局 概念 模型 的 过 程 如 图 7-7 所 示 。 


下 


把 同名 实体 类 型 作为 公 


首先 ,要 确定 各 局 部 结构 中 的 公共 实体 类 型 。 在 这 一 步 


SS | 总 < > SUPPLIER 
二 


需求 分 析 说 明 书 


确定 公共 实体 类 型 


P , 仅 根据 实体 类 型 名 和 关键 字 来 认定 公共 实体 类 型 。 一 般 


合并 两 个 E-R 图 


共 实 体 类 型 的 一 类 候选 ,把 具有 相同 


键 的 实体 类 型 作为 公共 实体 类 型 的 另 一 类 候选 。 接 下 来 就 要 


把 局 部 E-R 图 集成 为 全 
把 局 部 E-R 图 集成 


局 E-R 图 。 
为 全 局 ER 图 时 ,一般 采用 两 两 集成 


的 方法 , 即 先 将 具有 相同 实体 的 两 个 E-R 图 以 该 相同 实体 为 
基准 进行 集成 ,如 果 还 有 相同 实体 的 E-R 图 , 则 再 次 集成 ,这 
样 一 直 重 复 下 去 ,直到 所 有 具有 相同 实体 的 局 部 ER 图 都 被 
集成 为 止 ,从 而 得 到 全 局 的 ER 图 。 


由 于 各 类 应 用 不 同 
计 成 局 部 E-R 模型 ， 


,不 同 的 应 用 通常 又 由 不 同 的 人 员 设 
此 当 将 局 部 的 ER 图 集成 为 全 局 的 


检查 并 消除 冲突 


人 


进入 "全 局 E-R 模 型 的 优化 ” 
图 7-7 全 局 ER 图 设计 步骤 
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E-R 图 时 ,不 可 避免 地 会 有 不 一 致 的 地 方 , 称 之 为 冲突 。 通 常 可 能 存在 三 类 冲突 ,分 别 为 属 
性 冲突 ,命名 冲突 和 结构 冲突 。 

(1) 属性 冲突 

@ 属性 域 冲突 , 即 属性 值 的 类 型 \ 取 值 范围 或 取 值 集合 不 同 。 例 如 ,由 于 学 号 是 数字 ， 
因此 某 些 部 门 ( 即 局 部 应 用 ) 将 学 号 定义 为 整数 形式 ,而 由 于 学 号 不 用 参与 运算 ,因此 另 一 些 
部 门 ( 即 局 部 应 用 ) 将 学 号 定义 为 字符 型 形式 。 又 如 , 某 些 部 门 ( 即 局 部 应 用 ) 以 出 生日 期 形 
式 表示 学 生 的 年 龄 ,而 另 一 些 部 门 ( 即 局 部 应 用 ) 以 整数 形式 表示 学 生 的 年 龄 。 

@ 属性 取 值 单位 冲突 。 例 如 :学 生 的 身高 ,有 的 以 米 为 单位 ,有 的 以 厘米 为 单位 ,有 的 
以 尺 为 单位 。 

属性 冲突 通常 用 讨论 .协商 等 行政 手段 加 以 解决 。 

(2) 命名 冲突 

命名 冲突 通常 包括 同名 异 义 和 异 名 同 义 两 种 。 

@ 同名 异 义 , 即 不 同意 义 的 对 象 在 不 同 的 局 部 应 用 中 具有 相同 的 名 字 。 例 如 ,局 部 应 
A 中 将 教室 称 为 房间 ,局 部 应 用 B 中 将 学 生 宿 舍 称 为 房间 。 

@ 异 名 同 义 (一 义 多 名 ) , 即 同一 意义 的 对 象 在 不 同 的 局 部 应 用 中 具有 不 同 的 名 字 。 例 
如 ,有 的 部 门 把 教科 书 称 为 课本 ,有 的 部 门 把 教科 书 称 为 教材 。 

命名 冲突 可 能 发 生 在 实体 、 联 系 一 级 ,也 可 能 发 生 在 属性 一 级 。 其 中 属性 的 命名 冲突 更 
为 常见 。 处 理 命名 冲突 通常 也 像 处 理 属 性 冲突 一 样 ,通过 讨论 ,协商 等 行政 手段 加 以 解决 。 

(3) 结构 冲突 

结构 冲突 有 三 种 情况 : 

J@ 同一 对 象 在 不 同 应 用 中 具有 不 同 的 抽象 。 例 如 ,课程 "在 某 一 局 部 应 用 中 被 当 作 实 
体 ,而 在 另 一 局 部 应 用 中 被 当 作 属 性 。 

解决 方法 通常 是 把 属性 变换 为 实体 或 把 实体 变换 为 属性 ,使 同一 对 象 具有 相同 的 抽象 。 

@ 同一 实体 在 不 同 局 部 视图 中 所 包含 的 属性 不 完全 相同 ,或 者 属性 的 排列 次 序 不 完全 
相同 。 

这 是 很 常见 的 一 类 冲突 ,原因 是 不 同 的 局 部 应 用 关心 的 是 该 实体 的 不 同 侧面 。 解 决 方 
法 是 使 该 实体 的 属性 取 各 分 E-R 图 中 属性 的 并 集 ,再 适当 设计 属性 的 次 序 。 例 如 ,在 局 部 
应 用 A 中 ,“ 学 生 ” 实 体 由 学 号 、 姓 名 、 性 别 、 平 均 成 绩 四 个 属性 组 成 ; 在 局 部 应 用 B 中 ,“ 学 
生 ” 实 体 由 姓名 、 学 号 ,出 生日 期 ,所 在 系 \ 年 级 五 个 属性 组 成 ; 在 局 部 应 用 C 中 ,“ 学 生 ” 实 体 
由 姓名 、 政 治 面貌 两 个 属性 组 成 ; 在 合并 后 的 ER 图 中 ,“ 学 生 ” 实 体 的 属性 为 : 学 号 、 姓 名、 
性 别 . 出 生日 期 .政治 面貌 .所 在 系 、 年 级 .平均 成 绩 。 

@ 实体 之 间 的 联系 在 不 同 局 部 视图 中 呈现 不 同 的 类 型 。 例 如 ,实体 El 与 E2 在 局 部 应 
A 中 是 多 对 多 联系 ,而 在 局 部 应 用 B 中 是 一 对 多 联系 ; 又 如 在 局 部 应 用 XX 中 ,El 与 E2 
发 生 联系 ,而 在 局 部 应 用 YY 中 ,El、E2、E3 三 者 之 间 有 联系 。 

解决 方法 是 根据 应 用 的 语义 对 实体 联系 的 类 型 进行 综合 或 调整 。 


3. 全 局 E-R 图 模型 的 优化 


在 得 到 全 局 E-R 模型 后 ,为 了 提高 数据 库 系统 的 效率 ,还 应 进一步 依据 处 理 需 求 对 全 
局 ER 模型 进行 优化 。 
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一 个 好 的 全 局 ER 图 除了 能 反映 用 户 功能 需求 外 ,还 应 满足 下 列 条 件 : 
。 实体 类 型 个 数 尽 可 能 少 。 
实体 类 型 所 含 属性 尽 可 能 少 。 
。 实 体 类 型 间 联 系 无 元 余 。 
优化 就 是 要 达到 这 三 个 目的 ,但 有 时 为 了 提高 效率 ,根据 具体 情况 可 存在 适当 宛 余 。 


0.4 逻辑 结构 设计 


逻辑 结构 设计 就 是 将 概念 结构 转换 为 某 个 DBMS 所 支持 的 数据 模型 (如 关系 模型 ) ,并 
对 其 进行 优化 。 以 关系 模型 为 例 ,多 辑 结构 设计 就 是 将 概念 结构 (ER 图 ) 转 换 为 一 组 关系 
模式 ,也 就 是 将 E-R 图 所 表示 的 实体 、 实 体 的 属性 和 它们 之 间 的 联系 转化 为 关系 模式 ,转换 
过 程 中 可 以 采用 下 面 的 方法 。 


7.4.1 E-R 图 转换 为 数据 模型 


修 辑 结构 设计 将 信息 世界 的 概念 模型 E-R 图 转化 为 计算 机 世界 的 数据 模型 ,需要 遵循 
以 下 原则 (以 转换 为 关系 模型 为 例 ) 。 


1. 实体 转换 为 关系 


每 个 实体 都 可 以 转换 为 一 个 单独 的 关系 模式 ,实体 的 属性 就 是 关系 的 属性 ,实体 的 码 就 
是 关系 的 码 , 如 图 7-8 所 示 。 


图 7-8 E-R 示例 


E-R 图 中 的 教师 实体 可 以 转换 为 下 面 的 关系 模式 ,其 中 "职工 号 ?为 关系 的 码 (通常 给 属 
性 加 下 划 线 表示 码 ) ,例如 ,教师 (职工 号 ,姓名 ,性 别 , 出 生日 期 ,职称 )。 同 样 , 学 生 和 班级 也 
可 以 转换 为 关系 模式 : 学 生 ( 学 号 ,姓名 ,性 别 , 出 生日 期 ) 和 班级 (班级 号 ,学 生 人 数 ) 。 


号 ,学 4 
2. 联系 转换 为 关系 模式 


(1) m : n 型 的 联系 
m:n 型 的 联系 可 以 转换 为 一 个 单独 的 关系 模式 ,联系 中 各 实体 的 码 、 联 系 本 身 的 属性 
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一 起 转换 为 这 个 关系 模式 的 属性 ,同时 ,将 相关 实体 的 码 联合 起 来 作为 这 个 关系 模式 的 码 。 
依然 以 上 面 为 例 , “指导” 联系 是 一 个 m : n 型 的 联系 ,可 以 将 它 转 换 为 如 下 的 关系 模式 ,其 
中 “职工 号 "和 “班级 号 "联合 作为 关系 的 码 : 指导 (职工 号 ,班级 号 ,考评 成 绩 ) 。 

(2) 1 : nn 型 的 联系 

1: n 型 的 联系 有 两 种 转换 方法 : 

@ 可 以 转换 为 一 个 单独 的 关系 模式 ,联系 中 各 实体 的 码 、 联 系 本 身 的 属性 一 起 转换 为 
这 个 关系 模式 的 属性 ,n 端 实体 的 码 作 为 关系 的 码 。 

@ 可 以 合并 到 端的 关系 模式 中 。 

以 上 面 的 为 例 ,“ 组 成 "联系 为 1 : n 型 的 联系 ,一 种 方法 是 转换 为 一 个 单独 的 关系 模式 ， 
以 “学 生 ” 实 体 的 码 作 为 这 个 关系 模式 的 码 : 组 成 (学 号 ,班级 号 )。 

另 一 种 方法 是 将 其 与 学生” 关系 模式 合并 ,这 种 方法 更 为 合理 ,可 以 减少 系统 中 关系 的 
数量 ,提高 查询 效率 ,所 以 这 种 方法 更 可 取 。 转 换 后 ,“ 学 生 ” 的 关系 模式 为 : 学 生 ( 学 号 , 姓 
名 ,性 别 ,出 生日 期 ,班级 号 ,学 生 人 数 )。 

(3) 1 : 1 型 的 联系 

1: 1 型 的 联系 可 以 看 做 是 1 : n 型 的 联系 一 个 特殊 的 情况 ,所 以 与 1 : n 型 的 转换 类 
似 。 有 两 种 方法 : 

Q@ 可 以 转换 为 一 个 单独 的 关系 模式 ,联系 中 各 实体 的 码 、 联 系 本 身 的 属性 一 起 转换 为 
这 个 关系 模式 的 属性 ,同时 ,可 以 选择 任 一 个 实体 的 码 为 这 个 关系 的 候选 码 ; 

@ 可 以 合并 到 任意 一 端的 关系 模式 中 ,这 时 需要 在 该 关系 模式 的 属性 中 加 入 另 一 个 关 
系 模式 的 码 和 联系 本 身 的 属性 。 

上 面 的 E-R 图 中 没有 这 种 类 型 的 关系 ,可 以 这 样 构造 “学生 ”实体 改 成 “班长 "实体 ,一 
个 班级 只 有 一 个 班长 ,所 以 “班长 "和 “班级 "之 间 的 联系 是 1 : 1 型 的 联系 。“ 班 长 "管理 “ 班 
级 ”, 所 以 它们 之 间 存 在 “管理 ”的 联系 。 按照 上 面 的 转换 方法 ,可 以 转换 成 一 个 单独 的 关系 
模式 ,以 其 中 任意 一 个 实体 的 码 为 候选 码 。 关 系 模式 为 : 管理 (班长 学 号 ,班级 号 ) 或 管理 
(班级 号 ,班长 学 号 ) 。 在 实际 应 用 中 ,更 倾向 于 选择 第 二 种 方法 。 可 以 与 “班长 ”实体 的 关系 
模式 合并 ,并 且 在 关系 模式 中 加 入 “班级 ”实体 的 码 ,表示 为 : 班长 (班长 学 号 ,姓名 ,人 性别, 出 
生日 期 ,班级 号 ) 。 同 样 ,如 果 与 “班级 ”关系 模式 合并 , 则 为 : 班级 (班级 号 ,学 生 人 数 ,班长 
学 号 ) 。 

(4) 多 元 联系 转换 为 关系 模式 

将 三 个 或 三 个 以 上 的 多 元 联系 转换 为 一 个 单独 的 关系 模式 。 与 这 个 多 元 联系 相关 的 各 
实体 的 码 以 及 联系 的 属性 转换 为 关系 的 属性 ,相关 各 实体 的 码 组 合 为 关系 的 码 。 例 如 ,“ 住 
宿 ” 联 系 是 一 个 三 元 联系 ,可 以 将 它 转换 为 如 下 关系 模式 ,其 中 “学 生 号 ”“ 宿 舍 号 ”和 “床位 
号 ”联合 作为 关系 的 组 合 码 : 住宿 (学 生 号 ,宿舍 号 ,床位 号 ) 。 

(5) 实体 自 联系 转换 为 关系 模式 

同一 实体 集 上 的 联系 称 为 自 联 系 ,可 以 参照 实体 之 间 的 联系 进行 转换 。 


3. 具有 相同 码 的 关系 模式 可 合并 


如 果 两 个 关系 模式 具有 相同 的 主 码 ,可 以 考虑 将 它们 合并 为 一 个 关系 模式 。 合 并 方法 
是 将 其 中 一 个 关系 模式 的 全 部 属性 加 入 到 另 一 个 关系 模式 中 ,然后 去 掉 其 中 的 同 义 属性 (可 
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能 同名 也 可 能 不 同名 ) ,并 适当 调整 属性 的 次 序 。 

假如 有 一 个 学 生 关系 : 学 生 ( 学 号 ,姓名 ,性 别 , 出 生日 期 ); 还 有 一 个 所 属 班级 关系 : 所 
属 班级 (学 号 ,班级 )。 由 于 它们 的 主 码 都 为 “学 号 ”, 所 以 可 以 将 它们 合并 到 一 个 关系 模式 
中 : 学 生 ( 学 号 ,姓名 ,性 别 ,出 生日 期 ,班级 ) 。 

按照 上 述 方法 ,图 7-8 所 示 的 ER 图 可 以 转换 为 下 面 的 关系 模式 : 

学 生 ( 学 号 ,姓名 ,性 别 , 出 生日 期 ,班级 号 ) 


班级 (班级 号 ,学 生 人 数 ) 
教师 (职工 号 ,姓名 ,性 别 ,出 生日 期 ,职称 ) 
教学 (职工 号 ,学 号 ) 
指导 (职工 号 ,班级 号 ) 


7.4.2 关系 规范 化 


关系 规范 化 是 指 将 E-R 图 转换 为 数据 模型 后 ,通常 以 规范 化 理论 为 指导 ,对 关系 进行 
分 解 或 合并 ,这 是 关系 模式 的 初步 优化 。 一 般 按照 以 下 步骤 进行 : 

@ 考察 关系 模式 的 函数 依赖 关系 。 按 照 需 求 分 析 得 到 的 语义 关系 ,将 各 个 关系 模式 中 
的 函数 依赖 关系 提炼 出 来 ,并 进行 极 小 化 处 理 ,消除 元 余 。 

@ 按照 数据 依赖 理论 ,将 关系 模式 分 解 , 至 少 达到 第 三 范式 , 即 消除 部 分 函数 依赖 和 传 
递 依赖 。 并 不 是 规范 化 程度 越 高 关系 就 越 优 , 因为 规范 化 程度 越 高 ,系统 就 会 越 经 常 做 连接 
运算 ,这 是 以 牺牲 效率 为 代价 的 。 一 般 来 说 ,达到 第 三 范式 就 足够 了 。 


7.4.3 数据 模型 的 优化 


为 了 进一步 提高 数据 库 应 用 系统 的 性 能 ,还 可 以 对 产生 的 关系 模式 进行 进一步 优化 , 即 
修改 ,调整 和 重 构 。 根 据 需要 ,可 以 添加 适当 的 “ 宛 余 ”, 以 提高 效率 。 例 如 ,实体 班级 和 学 生 
的 关系 为 1 : 2 经 过 规范 化 后 :学 生 中 加 入 属性 * 所 在 班级 ,通过 对 相同 班 号 的 学 生 求 和 就 
可 以 得 到 某 班 的 人 数 , 可 是 这 种 求 班级 人 数 的 工作 是 经 常 做 的 ,而 且 对 于 班级 来 说 ,其 人 数 
也 是 非常 重要 的 属性 ,因此 可 以 在 班级 中 加 入 属性 “人 数 ”, 虽 然 这 是 宛 余 字 段 ,可 是 能 提高 
数据 库 的 整体 效率 ,这 是 很 值得 的 。 如 果 一 个 关系 的 某 个 属性 可 以 由 本 关系 的 其 他 属性 计 
算得 到 ,那么 这 绝对 是 宛 余 属性 ; 如 果 一 个 关系 的 某 个 属性 是 由 其 他 关系 的 属性 计算 得 来 
的 , 则 这 个 属性 在 某 些 时 候 可 以 加 在 此 关系 中 。 


7.4.4 设计 外 模式 


前 面 几 个 阶段 设计 出 的 关系 模式 是 系统 的 模式 ,为 了 实现 数据 和 应 用 程序 的 独立 性 ,在 
逻辑 结构 设计 阶段 还 要 根据 数据 库 系统 的 模式 设计 出 外 模式 (也 称 子 模式 或 用 户 模式 )。 外 
模式 是 保护 数据 库 安 全 性 的 一 个 有 力 措施 。 每 个 用 户 只 能 看 见 和 访问 所 对 应 的 外 模式 中 的 
数据 ,数据 库 中 的 其 余数 据 对 他 们 来 说 是 不 可 见 的 。 同 时 ,对 于 每 一 个 外 模式 ,数据 库 系统 
都 有 一 个 外 模式 /模式 映像 . 它 定义 了 该 外 模式 与 模式 之 间 的 对 应 关系 。 这 些 映 像 定义 通常 
包含 在 各 自 外 模式 的 描述 中 。 当 模式 改变 时 (如 增加 新 的 数据 类 型 .新 的 数据 项 、 新 的 关系 
等 ) ,由 数据 库 管 理 员 对 数据 库 外 模式 /模式 映像 做 相应 的 改变 ,可 以 使 外 模式 保持 不 变 。 从 
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而 应 用 程序 不 必修 改 , 保 证 了 数据 的 逻辑 独立 性 。 
在 设计 外 模式 时 ,要 注意 以 下 几 点 : 
。 按照 用 户 习 惯 进行 命名 ,包括 关系 名 、 属 性 名 。 外 模式 与 模式 的 属性 本 质 即使 相同 
也 可 以 取 不 同 的 名 字 。 
。 针对 用 户 的 不 同 级 别 定义 不 同 的 外 模式 ,以 保护 系统 的 安全 人 性。 
。 构造 必要 的 外 模式 ,以 简化 用 户 操作 。 


C3 数据 库 物 理 设计 


数据 库 的 物理 设计 是 对 于 给 定 的 逻辑 数据 模型 选取 一 个 最 适合 应 用 环境 的 物理 结构 的 
过 程 。 数 据 库 的 物理 结构 是 指数 据 库 在 物理 设备 上 的 存储 结构 与 存 取 方法 , 它 依 赖 于 给 定 
的 计算 机 系统 。 此 外 物理 设计 还 包括 物理 数据 库 结构 对 运用 需求 的 满足 ,如 存储 空间 、 存 取 
策略 方面 的 要 求 ,响应 时 间 及 系统 性 能 方面 的 要 求 等 。 

数据 库 的 物理 设计 可 以 分 两 步 进行 : 

Q@ 确定 数据 的 物理 结构 , 即 确定 数据 库 的 存 取 方法 和 存储 结构 。 

@ 对 物理 结构 进行 评价 。 

对 物理 结构 进行 评价 的 重点 是 时 间 和 效率 。 如 果 评 价 结构 满足 原 设 计 要 求 , 则 可 以 进 
行 物理 实施 ; 否则 应 该 重新 设计 或 修改 物理 结构 ,有 时 甚至 要 返回 逻辑 设计 阶段 修改 数据 
模型 。 


7.5.1 数据 库 物 理 设 计 的 内 容 和 方法 


由 于 不 同 的 数据 库 产 品 所 提供 的 物理 环境 、 存 取 方 法 和 存储 结构 各 不 相同 , 供 设计 人 员 
使 用 的 设计 变量 参数 范围 也 各 不 相同 ,所 以 数据 库 的 物理 设计 没有 通用 的 设计 方法 可 遵 
循 , 仅 有 一 般 的 设计 内 容 和 设计 原则 供 数据 库 设 计 人 员 参 考 。 

数据 库 设计 人 员 都 希望 自己 设计 的 物理 数据 库 结构 能 满足 事务 在 数据 库 上 运行 时 响应 
时 间 短 ,存储 空间 利用 率 高 和 事务 吞吐 率 大 的 要 求 。 为 此 ,设计 人 员 应 该 对 要 运行 的 事务 进 
行 详细 的 分 析 , 获 得 选择 物理 数据 库 设计 所 需要 的 参数 ,并 且 应 当 全 面 了 解 给 定 的 DBMS 
的 功能 .DBMS 提供 的 物理 环境 和 工具 ,尤其 是 存储 结构 和 存 取 方法 。 

数据 库 设计 者 在 确定 数据 存 取 方法 时 ,必须 清楚 三 种 相关 的 信息 : 

(1) 数据 库 查询 事务 的 信息 , 它 包 括 查 询 所 需要 的 关系 、 查 询 条 件 所 涉及 的 属性 、 连 接 
条 件 所 涉及 的 属性 、 查 询 的 投影 属性 等 信息 。 

(2) 数据 库 更 新 事务 的 信息 , 它 包 括 更 新 操作 所 需要 的 关系 、 每 个 关系 上 的 更 新 操作 所 
涉及 的 属性 ,修改 操作 要 改变 的 属性 值 等 信息 。 

(3) 每 个 事务 在 各 关系 上 运行 的 频率 和 性 能 要 求 。 

例如 , 某 个 事务 必须 在 5s 内 结束 ,这 对 于 存 取 方法 的 选择 有 直接 影响 。 这 些 事务 信息 
会 不 断 地 发 生变 化 ,所 以 数据 库 的 物理 结构 要 能 够 做 适当 的 调整 ,以 满足 事务 变化 的 需要 。 

关系 数据 库 物 理 设计 的 内 容 主 要 指 选 择 存 取 方法 和 存储 结构 ,包括 确定 关系 、 索 引 、 至 
簇 .日 志 、 备 份 等 的 存储 安排 和 存储 结构 ,确定 系统 配置 等 。 
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7.5.2 关系 模式 存 取 方 法 的 选择 


由 于 数据 库 是 为 多 用 户 共享 的 系统 , 它 需要 提供 多 条 存 取 路 径 才 能 满足 多 用 户 共享 数 
据 的 需求 。 数 据 库 物理 设计 的 任务 之 一 就 是 确定 建立 哪些 存 取 路 径 和 选择 哪些 数据 存 取 方 
法 。 关 系数 据 库 常用 的 存 取 方法 有 索引 方法 、 聚 簇 方法 和 HASH 方法 等 。 


1. 索引 存 取 方 法 的 选择 


选择 索引 存 取 方 法 实际 上 就 是 根据 应 用 要 求 确定 对 关系 的 哪些 属性 列 建立 索引 ,对 哪 
些 属性 列 建立 组 合 索 引 , 对 哪些 建立 唯一 索引 等 。 选 择 索引 方法 的 基本 原则 是 : 

(1) 如 果 一 个 属性 经 常 在 查询 条 件 中 出 现 , 则 考虑 在 这 个 属性 上 建立 索引 ; 如 果 一 组 
属性 经 常 在 查询 条 件 中 出 现 , 则 考虑 在 这 组 属性 上 建立 组 合 索 引 。 

(2) 如 果 一 个 属性 经 常 作为 最 大 值 和 最 小 值 等 聚集 函数 的 参数 , 则 考虑 在 这 个 属性 上 
建立 索引 。 

(3) 如 果 一 个 属性 经 常 在 连接 操作 的 连接 条 件 中 出 现 , 则 考虑 在 这 个 属性 上 建立 索引 ; 
同 理 ,如 果 一 组 属性 经 常 在 连接 操作 的 连接 条 件 中 出 现 , 则 考虑 在 这 组 属性 上 建立 索引 。 

(4) 关系 上 定义 的 索引 数 要 适当 ,并 不 是 越 多 越 好 ,因为 系统 要 为 维护 索引 付出 代价 ， 
也 要 为 查找 索引 付出 代价 。 例 如 ,更 新 频率 很 高 的 关系 上 定义 的 索引 ,数量 就 不 能 太 多 , 因 
为 更 新 一 个 关系 时 ,必须 对 这 个 关系 上 有 关 的 索引 做 相应 的 修改 。 


2. 聚 徐 存 取 方 法 的 选择 


为 了 提高 某 个 属性 或 属性 组 的 查询 速度 ,把 这 个 属性 或 属性 组 上 具有 相同 值 的 元 组 集 
中 存放 在 连续 的 物理 块 上 的 处 理 称 为 聚 簇 ,这 个 属性 或 属性 组 称 为 聚 秘 码 。 

(1) 建立 聚 入 的 必要 性 

聚 秘 功能 可 以 大 大 提高 按 聚 徐 码 进行 查询 的 效率 。 例 如 要 查询 计算 机 系 所 有 学 生 的 名 
单 ,假设 计算 机 系 有 200 名 学 生 , 在 极端 情况 下 ,这 200 名 学 生 所 对 应 的 数据 元 组 分 布 在 
200 个 不 同 的 物理 块 上 。 尽 管 对 学 生 关系 已 按 所 在 系 建立 了 索引 ,由 索引 会 很 快 找到 计算 
机 系 学 生 的 元 组 标识 ,避免 了 全 表 扫 描 。 然 而 再 由 元 组 标识 去 访问 数据 块 时 就 要 存 取 200 
个 物理 块 , 执 行 200 次 W/O 操作 。 如 果 将 同一 系 的 学 生 元 组 集中 存放 , 则 每 读 一 个 物理 块 就 
可 以 得 到 多 个 满足 查询 条 件 的 元 组 ,从 而 可 以 显著 地 减少 访问 磁盘 的 次 数 。 聚 簇 功能 不 但 
适用 于 单个 关系 ,而 且 适用 于 经 常 进行 连接 操作 的 多 个 关系 , 即 把 多 个 连接 关系 的 元 组 按 连 
接 属性 值 聚集 存放 ,聚集 中 的 连接 属性 称 为 聚 答 码 。 这 就 相当 于 把 多 个 关系 按 “ 预 连接 ”的 
形式 存放 ,从 而 大 大 提高 了 连接 操作 的 效率 。 

(2) 建立 聚 簇 的 基本 原则 

一 个 数据 库 可 以 建立 多 个 聚 簇 ,但 一 个 关系 只 能 加 入 一 个 聚 秘 。 选 择 聚 秘 存 取 方法 就 
是 确定 需要 建立 多 少 个 聚 簇 ,确定 每 个 聚 簇 中 包括 哪些 关系 。 聚 簇 设 计时 可 以 分 两 步 进 行 : 
先 根 据 规 则 确定 候选 聚 侯 ,再 从 候选 聚焦 中 去 除 不 必要 的 关系 。 

设计 候选 聚 簇 的 原则 是 : 

@ 对 经 常 在 一 起 进行 连接 操作 的 关系 可 以 建立 聚 簇 。 

@ 如 果 一 个 关系 的 一 组 属性 经 常 出 现在 相等 、 比 较 条 件 中 , 则 该 单个 关系 可 建立 聚 簇 。 
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@ 如 果 一 个 关系 的 一 个 (或 一 组 ) 属 性 上 的 值 重复 率 很 高 . 则 此 单个 关系 可 建立 聚 徐 。 
也 就 是 说 对 应 每 个 聚 乱码 值 的 平均 元 组 不 能 太 少 , 如 果 太 少 了 . 聚 簇 的 效果 不 明显 。 

@ 如 果 关 系 的 主要 应 用 是 通过 聚 簇 码 进行 访问 或 连接 ,而 其 他 属性 访问 关系 的 操作 很 
少 , 则 可 以 使 用 聚 徐 。 尤 其 是 当 SQL 语句 中 包含 有 与 聚 徐 有 关 的 ORDER BY、GROUP 
BY 、UNION、DISTINCT 等 字句 或 短语 时 ,使 用 聚 簇 特别 有 利 , 可 以 省 去 对 结果 集 的 排序 操 
作 。 反 之 , 当 关 系 较 少 利用 聚 簇 码 操作 时 ,最 好 不 要 使 用 聚 簇 。 

检查 候选 聚 簇 ,取消 其 中 不 必要 关系 的 方法 是 : 

Q@ 从 聚 簇 中 删除 经 常 进行 全 表 扫 描 的 关系 。 

@ 从 聚 秘 中 删除 更 新 操作 远 多 于 连接 操作 的 关系 。 

@ 不 同 的 聚 徐 中 可 能 包含 相同 的 关系 ,一 个 关系 可 以 在 某 一 个 聚 簇 中 ,但 不 能 同时 加 
人 多 个 聚 徐 。 要 从 这 多 个 聚 徐 方 案 ( 包 括 不 建立 聚 簇 ) 中 选择 一 个 较 优 的 ,其 标准 是 在 这 个 
聚 徐 上 运行 各 种 事务 的 总 代价 最 小 。 

(3) 建立 聚 簇 应 注意 的 问题 

建立 聚 簇 时 ,应 注意 三 个 问题 : 

@ 聚 簇 虽然 提高 了 某 些 应 用 的 性 能 ,但 是 建立 与 维护 聚 簇 的 开销 是 相当 大 的 。 

@ 对 已 有 的 关系 建立 聚 入 ,将 导致 关系 中 的 元 组 移动 其 物理 存储 位 置 ,这 样 会 使 关系 
上 原 有 的 索引 无 效 , 要 想 使 用 原 索引 就 必须 重建 原 有 索引 。 

@ 当 一 个 元 组 的 聚 簇 码 值 改 变 时 ,该 元 组 的 存储 位 置 也 要 做 相应 地 移动 ,所 以 聚 簇 码 
值 应当 相 对 稳定 ,以 减少 修改 聚 簇 码 值 所 引起 的 维护 开销 。 


7.5.3 确定 数据 库 的 存储 结构 


确定 数据 的 存储 位 置 和 存储 结构 要 综合 考虑 存 取 时 间 、 存 储 空间 利用 率 和 维护 代价 三 
方面 的 因素 。 这 三 个 方面 常常 相互 矛盾 ,需要 进行 权衡 ,选择 一 个 折 中 的 方案 。 


1. 确定 数据 的 存放 位 置 


为 了 提高 系统 性 能 ,应 该 根据 应 用 情况 将 数据 的 易 变 部 分 与 稳定 部 分 .经常 存 取 部 分 和 
存 取 频 率 较 低 部 分 分 开 存放 。 对 于 有 多 个 磁盘 的 计算 机 ,可 以 采用 下 面 几 种 存 取 位 置 的 分 
配方 案 。 

(1) 将 表 和 索引 放 在 不 同 的 磁盘 上 ,这 样 在 查询 时 ,由 于 两 个 磁盘 驱动 器 并 行 工作 ,可 
以 提高 物理 I/O 读 写 的 效率 。 

(2) 将 比较 大 的 表 分 别 存放 在 两 个 磁盘 上 ,以 加 快 存 取 速度 ,这 在 多 用 户 环境 下 特别 有 效 。 

(3) 将 日 志文 件 、 备 份 文件 与 数据 库 对 象 ( 表 、 索 引 等 ) 放 在 不 同 的 磁盘 上 ,以 改进 系统 
的 性 能 。 

(4) 对 于 经 常 存 取 或 对 存 取 时 间 要 求 高 的 对 象 (如 表 、 索 引 ) 应 放 在 高 速 存储 器 (如 硬 
盘 ) 上 ,对 于 存 取 效 率 小 或 对 存 取 时 间 要 求 低 的 对 象 (如 数据 库 的 数据 备份 和 日 志文 件 备份 
等 只 在 故障 恢复 时 才 使 用 ) ,如 果 数 据 量 很 大 ,可 以 存放 在 低速 存储 设备 上 。 

由 于 各 个 系统 所 能 提供 的 对 数据 进行 物理 安排 的 手段 .方法 差异 很 大 ,因此 设计 人 员 应 
该 仔细 了 解 给 定 的 DBMS 提供 的 方法 和 参数 ,针对 具体 应 用 环境 的 要 求 , 对 数据 进行 适当 
的 物理 安排 。 
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2. 确定 系统 配置 


DBMS 产品 一 般 都 提供 了 一 些 系 统 配 置 变 量 和 存储 分 配 参数 供 设计 人 员 和 DBA 对 数 
据 库 进行 物理 优化 。 在 初始 情况 下 ,系统 都 为 这 些 变量 赋予 了 合理 的 默认 值 。 但 是 这 些 默 
认 值 不 一 定 适合 每 一 种 应 用 环境 。 在 进行 数据 库 的 物理 设计 时 ,还 需要 重新 对 这 些 变量 赋 
值 , 以 改善 系统 的 性 能 。 

系统 配置 变量 很 多 ,例如 同时 使 用 数据 库 的 用 户 数 、 同 时 打开 的 数据 库 对 象 数 、 内 存 分 
配 参数 .缓冲 区 分 配 参数 (使 用 的 缓冲 区 长 度 ` 个 数 ) 存储 分 配 参 数 、 物 理 块 的 大 小 、 物 理 块 
装填 因子 .时 间 片 大 小 数据库 的 大 小 和 锁 的 数目 等 ,这 些 参数 值 影 响 存 取 时 间 和 存储 空间 
的 分 配 。 进 行 物理 设计 时 需要 根据 应 用 环境 确定 这 些 参 数值 ,以 使 系统 性 能 最 佳 。 
进行 物理 设计 时 对 系统 配置 变量 的 调整 只 是 初步 的 ,在 系统 运行 时 还 要 根据 实际 运行 
情况 做 进一步 的 参数 调整 ,以 提升 系统 性 能 。 


3. 评价 物理 结构 


在 设计 过 程 中 ,效率 问题 的 考虑 只 能 在 各 种 约束 得 到 满足 且 确 定 方案 可 行 之 后 进行 。 
下 面 介绍 一 下 物理 设计 的 性 能 。 

多 性 能 测量 方面 设计 者 能 灵活 地 对 初始 设计 过 程 和 未 来 的 修整 做 出 决策 。 假 设 数据 库 
性 能 用 “开销 ”(Cost) ,即时 间 、 空 间 及 可 能 的 费用 来 衡量 , 则 在 数据 库 应 用 系统 生存 期 中 ,总 
的 开销 包括 规划 开销 、 设 计 开销 、 实 施 和 测试 开销 ,操作 开 销 和 运行 维护 开销 。 

对 物理 设计 者 来 说 , 主要 考虑 操作 开销 , 即 为 使 用 户 获得 及 时 、 准 确 的 数据 所 需 的 开销 
和 计算 机 资源 的 开销 。 可 分 为 如 下 几 类 : 

(1) 查询 和 响应 时 间 : 响应 时 间 定 义 为 从 查询 开始 到 查询 结果 开始 显示 之 间 所 经 历 的 
时 间 , 它 包括 CPU 服务 时 间 、CPU 队列 等 待 时 间 、1/O 队列 等 待 时 间 、 封 锁 延 迟 时 间 和 通信 
延迟 时 间 。 

一 个 好 的 应 用 程序 设计 可 以 减少 CPU 服务 时 间 和 1/O 服务 时 间 。 例 如 ,有 效 地 使 
数据 压缩 技术 ,选择 好 访问 路 径 和 合理 安排 记录 的 存储 等 ,都 可 以 缩短 服务 时 间 。 

(2) 更 新 事务 的 开销 : 主要 包括 修改 索引 、 重 写 物理 块 或 文件 、 校 验 等 方面 的 开销 。 

(3) 报告 生成 的 开销 : 主要 包括 检索 ,重组 ,排序 和 结果 显示 方面 的 开销 。 

(4) 主 存储 空间 开销 : 包括 程序 和 数据 所 占用 的 空间 的 开销 。 一 般 对 数据 库 设计 者 来 
说 ,可 以 对 缓冲 区 分 配 (包括 缓冲 区 个 数 和 大 小 ) 做 适当 的 调整 ,以 减少 空间 开销 。 

(5) 辅助 存储 空间 : 分 为 数据 块 和 索引 块 两 种 空间 。 设 计 者 可 以 控制 索引 块 的 大 小 、 
装载 因子 .指针 选择 项 和 数据 元 余 度 等 。 

实际 上 ,数据 块 设计 者 能 有 效 控制 1/O 服务 和 辅助 空间 ; 有 限 地 控制 封锁 延迟 ,CPU 
时 间 和 主 存 空 间 ; 而 完全 不 能 控制 CPU 和 1/O 队列 等 待 时 间 , 以 及 数据 通信 延迟 时 间 。 


0.6 数据 库 实施 


对 数据 库 的 物理 设计 初步 评价 完成 后 就 可 以 开始 建立 数据 库 了 。 数 据 库 实施 主要 包括 
以 下 几 个 方面 的 内 容 : 
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。 用 DDL 定义 数据 库 结构 ; 
。 组 织 数据 入 库 ; 

。 编制 与 调试 应 用 程序 ; 

。 数据 库 试 运行 。 


7.6.1 定义 数据 结构 


确定 了 数据 库 的 逻辑 结构 与 物理 结构 后 ,就 可 以 用 所 选用 的 DBMS 提供 的 数据 定义 语 
言 (DDL) 来 严格 描述 数据 库 结 构 。 
例如 ,可 以 用 SQL 语句 定义 如 下 表 结 构 : 


CREATE TABLE 学 生 
(学 号 StudentNo(8)， 


) 
CREATE TABLE 课程 
(课程 号 CourseNo(8)， 


); 
接 下 来 是 在 这 些 基 本 上 定义 视图 : 
CREATE VIEW .~ 

( 


) 


7.6.2 数据 装载 


数据 库 结 构建 立 好 后 ,就 可 以 向 数据 库 中 装载 数据 了 。 组 织 数据 入 库 是 数据 库 实施 阶 
段 最 主要 的 工作 。 

对 于 数据 量 不 是 很 大 的 小 型 系统 ,可 以 用 人 工 方法 完成 数据 的 入 库 , 其 步骤 如 下 : 

中 筛选 数据 。 需 要 装 入 数据 库 中 的 数据 通常 都 分 散在 各 个 部 门 的 数据 文件 或 原始 赁 
证 中 ,所 以 首先 必须 把 需要 和 人 库 的 数据 筛选 出 来 。 

@ 转换 数据 格式 。 筛 选 出 来 的 需要 入 库 的 数据 ,其 格式 往往 不 符合 数据 库 要 求 , 还 需 
要 进行 转换 ,这 种 转换 有 时 可 能 很 复杂 。 

@ 输入 数据 。 将 转换 好 的 数据 输入 计算 机 中 。 

@ 校 验 数据 。 检 查 输入 的 数据 是 否 有 误 。 

对 于 大 中 型 系统 ,由 于 数据 量 极 大 ,用 人 工 方 式 组 织 数据 入 库 将 会 耗费 大 量 人 力 物 力 ， 
而 且 很 难保 证 数据 的 正确 性 。 因 此 应 该 设计 一 个 数据 输入 子 系统 ,由 计算 机 辅助 数据 的 入 
库 工 作 。 其 步骤 如 下 : 

@ 筛选 数据 。 

四 输入 数据 。 由 录入 人 员 将 原始 数据 直接 输入 到 计算 机 中 。 数 据 输入 子 系统 应 提供 
输入 界面 。 

@ 校 验 数据 。 数 据 输 入 子 系统 采用 多 种 检验 技术 检查 输入 数据 的 正确 性 。 
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@ 转换 数据 。 数 据 输入 子 系 统 根据 数据 库 系统 的 要 求 ,从 录入 的 数据 中 抽取 有 用 成 
分 ,对 其 进行 分 类 ,然后 转换 数据 格式 。 抽 取 、 分 类 和 转换 数据 是 数据 输入 子 系统 的 主要 工 
作 ,也 是 数据 输入 子 系统 的 复杂 性 所 在 。 

@ 综合 数据 。 数 据 输 入 子 系统 根据 系统 的 要 求 将 转换 好 的 数据 进一步 综合 成 最 终 数 
据 。 要 完成 转换 数据 综合 数 据 两 项 工作 ,直接 将 老 系统 中 的 数据 转换 成 新 系统 中 需要 的 数 
据 格式 即 可 。 

为 了 保证 数据 能 够 及 时 和 人 库 ,应 在 进行 数据 库 物 理 设计 的 同时 编制 数据 输入 子 系统 。 


7.6.3 编制 与 调试 应 用 程序 


数据 库 应 用 程序 的 设计 应 该 与 数据 库 设计 并 行进 行 。 在 数据 库 实 施 阶段 , 当 数 据 库 结 
构建 立 好 后 ,就 可 以 开始 编制 与 调试 数据 库 的 应 用 程序 了 ,也 就 是 说 ,编制 与 调试 应 用 程序 
是 与 组 织 数据 入 库 同步 进行 的 。 调 试 应 用 程序 时 由 于 数据 入 库 尚 未 完成 ,可 先 使 用 模拟 
数据 。 


7.6.4 数据库 试 运行 


应 用 程序 调试 完毕 ,并 且 已 有 一 小 部 分 数据 入 库 后 ,就 可 以 开始 数据 库 的 试 运行 。 数 据 
库 试 运行 也 称 联合 调试 ,其 主要 工作 包括 以 下 几 个 方面 。 


1. 功能 测试 
即 实际 运行 应 用 程序 ,执行 对 数据 库 的 各 种 操作 ,测试 应 用 程序 的 各 种 功能 。 


2. 性 能 测试 


即 测量 系统 的 性 能 指标 ,分 析 是 否 符合 设计 目标 。 

数据 库 物 理 设计 阶段 在 评价 数据 库 结构 估算 时 间 、 空 间 指 标 时 ,做 了 许多 简化 和 假设 ， 
忽略 了 许多 次 要 因素 ,因此 结果 必然 很 粗糙 。 数 据 库 试 运行 则 是 要 实际 测量 系统 的 各 种 性 
能 指标 (不 仅 是 时 间 、 空 间 指 标 ) ,如果 结果 不 符合 设计 目标 , 则 需要 返回 物理 设计 阶段 ,调整 
物理 结构 ,修改 参数 ; 有 时 甚至 需要 返回 迎 辑 设计 阶段 ,调整 逻辑 结构 。 

重新 设计 物理 结构 .调整 逻辑 结构 ,会 导致 数据 重新 入 库 。 由 于 数据 入 库 的 工作 量 实在 
太 大 ,因此 可 以 采用 分 期 输入 数据 的 方法 , 即 先 输入 一 小 批量 数据 供 先期 联合 调试 使 用 , 待 
试 运行 基本 合格 后 再 输入 大 批量 数据 ,逐步 增加 数据 量 ,逐步 完成 运行 评价 。 

在 数据 库 试 运行 阶段 ,由 于 系统 不 稳定 , 硬 、 软 件 故障 随时 都 有 可 能 发 生 。 而 系统 的 操 
作 人 员 对 新 系统 还 不 熟悉 , 误 操 作 也 不 可 避免 ,因此 必须 做 好 数据 库 的 转 储 和 恢复 工作 , 尽 
量 减少 对 数据 库 的 破坏 。 


7.6.5 ”数据库 其 他 设计 


其 他 设计 工作 包括 对 数据 库 的 安全 性 、 完 整 性 一致 性 和 可 恢复 性 等 的 设计 。 这 些 设计 
总 是 以 牺牲 效率 为 代价 的 ,设计 人 员 的 任务 就 是 要 在 效率 和 尽 可 能 多 的 功能 之 间 进 行 合 理 
权衡 。 
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1. 数据 库 的 再 组 织 


设计 者 对 数据 库 的 概念 .逻辑 和 物理 结构 的 改变 称 为 再 组 织 。 再 组 织 通常 是 由 于 环境 
需求 的 变化 或 性 能 原因 引起 的 。 一 般 , 数 据 库 管理 系统 都 提供 数据 库 的 再 组 织 应 用 程序 。 


2. 故障 恢复 方案 设计 


数据 库 设计 中 考虑 的 故障 恢复 方案 ,一 般 都 是 基于 数据 库 管理 系统 提供 的 故障 恢复 手 
段 的 。 如 果 数 据 库 管 理 系统 已 提供 了 完善 的 软 硬 件 故障 恢复 和 存储 介质 的 故障 恢复 手段 ， 
那么 设计 阶段 的 任务 就 简化 为 确定 系统 登录 的 物理 参数 .缓冲 区 个 数 、 大 小 、 修 辑 块 的 长 度 、 
物理 设备 等 。 否 则 ,就 要 指定 人 工 备 份 方 案 。 


3. 安全 性 考虑 


许多 数据 库 管 理 系统 都 有 描述 各 种 对 象 ( 如 记录 ,数据 项 ) 的 存 取 权限 的 成 分 ,在 设计 
时 ,根据 对 用 户 需 求 的 分 析 ,规定 相 应 的 存 取 权限 。 子 模式 是 实现 安全 性 要 求 的 一 个 重要 手 
段 。 也 可 以 在 应 用 程序 中 设置 密码 ,对 不 同 的 使 用 者 分 配 一 定 的 密码 ,以 密码 控制 使 用 
级 别 。 


4. 事务 控制 


大 多 数 数据 库 管 理 系 统 都 支持 事务 概念 ,以 保证 多 用 户 环境 下 的 数据 完整 性 和 一 致 性 。 
事务 控制 有 人 工 和 系统 两 种 控制 办 法 ,系统 控制 以 数据 操作 语句 为 单位 ,人 工控 制 则 由 程序 
员 以 事务 的 开始 和 结束 语句 显示 实现 。 大 多 数 DBMS 提供 封锁 粒度 的 选择 ,封锁 粒度 一 般 
有 表 级 、 页 面 级 \ 记 录 级 和 数据 项 级 ,粒度 越 大 控制 越 简单 ,但 并 发 控制 性 能 差 ,这 些 在 设计 
中 都 要 运筹 考虑 。 


(3 数据 库 运行 和 维护 


数据 库 试 运行 结果 符合 设计 目标 后 ,数据 库 就 可 以 真正 投入 运行 了 。 数 据 库 投入 运行 
标志 着 开发 任务 的 基本 完成 和 维护 工作 的 开始 ,并 不 意味 着 设计 过 程 的 终结 。 由 于 应 用 环 
境 在 不 断 变 化 ,数据 库 运行 过 程 中 物理 存储 也 会 不 断 变化 ,对 数据 设计 进行 评价 、 调 整修 改 
等 维护 工作 是 一 个 长 期 的 任务 ,也 是 设计 工作 的 继续 和 提高 。 

在 数据 库 运 行 阶段 ,对 数据 库 经 常 性 的 维护 工作 主要 是 由 DBA 完成 的 , 它 包括 以 下 
内 容 。 


7.7.1 数据 库 的 转 储 与 恢复 


数据 库 的 转 储 和 恢复 是 系统 正式 运行 后 最 重要 的 维护 工作 之 一 ,DBA 要 针对 不 同 的 应 
要 求 指定 不 同 的 转 储 计划 ,定期 对 数据 库 和 日 志文 件 进行 备份 ,以 保证 一 旦 发 生 故 障 , 能 
利用 数据 库 备份 及 日 志文 件 备份 ,尽快 将 数据 库 恢 复 到 某 种 一 致 性 状态 ,并 尽 可 能 减少 对 数 
据 库 的 破坏 。 
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7.7.2 数据库 的 安全 性 与 完整 性 维护 


DBA 必须 对 数据 库 的 安全 性 和 完整 性 控制 负 起 责任 。 根 据 用 户 的 实际 需要 授予 不 同 
的 操作 权限 。 此 外 ,在 数据 库 运 行 过 程 中 ,由 于 应 用 环境 的 变化 ,对 安全 性 的 要 求 也 会 发 生 
变化 ,比如 有 的 数据 原来 是 机 密 , 现 在 是 可 以 公开 查询 了 ,而 新 加 入 的 数据 又 可 能 是 机 密 了 。 
而 系统 中 用 户 的 密级 也 会 变化 ,这 些 都 需要 DBA 根据 实际 情况 修改 原 有 的 安全 性 控制 。 
同样 ,由 于 应 用 环境 的 变化 ,数据 库 的 完整 性 约束 条 件 也 会 发 生变 化 ,也 需要 DBA 不 断 修 
正 , 以 满足 用 户 要 求 。 


7.7.3 ”数据 库 性 能 的 监督 与 改进 


在 数据 库 运 行 过 程 中 ,监督 系统 运行 ,对 监测 数据 进行 分 析 , 找 出 改进 系统 性 能 的 方法 
是 DBA 的 又 一 重要 任务 。 目 前 ,许多 DBMS 产品 都 提供 了 检测 系统 性 能 参数 的 功能 ,DBA 
可 以 利用 这 些 工具 方便 地 得 到 系统 运行 过 程 中 一 系列 性 能 参数 的 值 。DBA 应 该 仔细 分 析 
这 些 数 据 , 判 断 当前 系统 是 否 处 于 最 佳 运行 状态 ,如 果 不 是 , 则 需要 通过 调整 某 些 参数 来 进 
一 步 改进 数据 库 性 能 。 


7.7.4 数据 库 的 功能 完善 


数据 库 运行 一 段 时 间 后 ,由 于 记录 不 断 被 增 、 删 \ 改 ,会 使 数据 库 的 物理 存储 变 坏 ,从 而 
降低 数据 库存 储 空间 的 利用 率 和 数据 的 存 取 效 率 ,使 数据 库 的 性 能 下 降 。 这 时 DBA 就 要 
对 数据 库 进行 重组 织 ,或 部 分 重组 织 ( 只 对 频繁 增 、 删 的 表 进 行 重组 织 )。 数 据 库 的 重组 织 不 
会 改变 原 设 计 的 数据 逻辑 结构 和 物理 结构 ,只 是 按 原 设计 要 求 重新 安排 存储 位 置 ,回收 垃 
圾 ,减少 指针 链 , 提 高 系统 性 能 。DBMS 一 般 都 提供 了 重组 织 数据 库 使 用 的 应 用 程序 ,帮助 
DBA 重新 组 织 数据 库 。 

当 数 据 库 应 用 环境 发 生变 化 时 .例如 ,增加 新 的 应 用 或 新 的 实体 ,取消 某 些 已 有 应 用 , 改 
变 某 些 已 有 应 用 ,这 些 都 会 导致 实体 及 实体 间 的 联系 也 发 生 相 应 的 变化 ,使 原 有 的 数据 库 设 
计 不 能 很 好 地 满足 新 的 需求 ,从 而 不 得 不 适当 调整 数据 库 的 模式 和 内 模式 。 例 如 ,增加 新 的 
数据 项 ,改变 数据 项 的 类 型 ,改变 数据 库 的 容量 ,增加 或 删除 索引 ,修改 完整 性 约束 条 件 等 。 
这 就 是 数据 库 重 构造 。DBMS 都 提供 了 修改 数据 结构 的 功能 。 

重 构造 数据 库 的 程度 是 有 限 的 ,如 果 应 用 变化 太 大 .已 无 法 通过 重 构 数据 库 来 满足 新 的 
需求 ,或 重 构 数据 库 的 代价 太 大 , 则 表明 现 有 数据 库 应 用 系统 的 生命 周期 已 经 结束 ,应 该 重 
新 设计 新 的 数据 库 系 统 , 开 始 新 数据 库 应 用 系统 的 生命 周期 了 。 


.8 本 章 小 结 


本 章 主要 讨论 数据 库 设计 的 方法 和 步骤 ,详细 介绍 了 数据 库 设计 中 规划 、 需 求 分 析 、 概 
念 设 计 、 物 理 设 计 及 运行 与 维护 各 个 阶段 的 目标 ,方法 和 应 注意 的 事项 。 其 中 ,概念 结构 设 
计 和 逮 辑 结构 设计 是 整个 数据 库 设 计 过 程 中 最 重要 的 两 个 环节 ,也 是 本 章 重点 介绍 的 内 容 。 
在 本 章 的 学 习 中 ,不 但 要 通过 书 中 介绍 的 理论 和 实例 掌握 数据 库 设计 的 基本 方法 ,还 要 
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学 习 在 实际 工作 中 运用 这 些 思 想 ,设计 出 符合 应 用 需求 的 数据 库 应 用 系统 。 


(0.9 习题 


7.9.1 名 词 解 释 
需求 分 析 ,概念 结构 设计 逻辑 结构 设计 物理 结构 设计 分 类 .聚集 
7.9.2 简 答题 


. 简 述 数据 库 设计 过 程 。 

. 简 述 数据 库 设 计 过 程 各 个 阶段 的 设计 描述 。 
. 试 述 数据 库 设 计 方法 。 

.数据 库 设计 的 需求 分 析 阶 段 主 要 任务 是 什么 ? 调查 的 内 容 是 什么 ? 
.需求 分 析 阶 段 应 注意 哪些 问题 ? 

. 简 述 概念 设计 的 设计 策略 和 具体 步骤 。 
.什么 是 数据 抽象 ? 主要 有 哪 两 种 形式 的 抽象 ? 
. 试 述 采用 ER 方法 的 数据 库 概 念 设计 的 过 程 。 
. 简 述 逻辑 结构 设计 阶段 的 主要 内 容 。 

10. 简 述 数据 库 物理 设计 的 内 容 和 步骤 。 

11. 数据 库 运 行 和 维护 阶段 主要 有 哪些 工作 ? 


7.9.3 综合 题 


某 医院 病房 计算 机 管理 系统 需要 如 下 信息 : 

科室 : 科 名 , 科 电 话 , 科 地 址 ,医生 姓名 ; 

病房 : 病房 号 ,床位 号 ,所 属 科室 名 ; 

医生 : 姓名 ,职称 ,年 龄 ,所 属 科 室 名 ,工作 证 号 ; 

病人 : 病历 号 ,姓名 ,性 别 , 诊 断 ,主管 医生 ,病房 号 。 

其 中 ,一 个 科室 有 多 个 病房 、 多 个 医生 ,一 个 病房 只 能 属于 一 个 科室 ,一 个 医 4 
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个 科室 ,但 可 负责 多 个 病人 的 诊治 ,一 个 病人 的 主管 医生 只 有 一 个 。 
(1) 用 ER 图 表示 该 系统 的 概念 模型 。 
(2) 将 得 到 的 E-R 图 转化 为 等 价 的 关系 模型 ,并 指出 每 个 关系 模式 的 主 码 。 


@.1 嵌入 式 SOL 


当 数 据 库 设 计 好 并 建立 后 ,就 可 以 着 手 开 发 前 人 台 的 应 用 程序 了 。 本 章 将 详细 讲述 如 何 
用 编程 工具 或 语言 来 访问 、 连 接 以 及 操纵 后 台数 据 库 。 


8.1.1 嵌入 式 SQL 的 特点 


SQL 是 一 种 双重 式 语言 , 它 既是 一 种 用 于 查询 和 更 新 的 交互 式 数据 库 语言 ,又 是 一 种 
应 用 程序 进行 数据 库 访 问 时 所 采用 的 编程 式 数据 库 语 言 , 即 SQL 具有 交互 式 与 嵌入 式 两 种 
形式 : 
。 交互 式 SQL: 一 般 DBMS 都 提供 联机 交互 工具 ,用 户 可 直接 输入 SQL 命令 对 数据 
库 进 行 操作 ,由 DBMS 来 进行 解释 。 
。 戏 入 式 SQL: 能 将 SQL 语句 嵌入 到 高 级 语言 中 ,使 应 用 程序 充分 利用 SQL 访问 数 
据 库 的 能 力 和 高 级 语言 的 过 程 处 理 能 力 ,一 般 需 要 预 编译 ,将 内 入 的 SQL 语句 转化 
为 高 级 语言 编译 器 能 处 理 的 语句 。 嵌 入 SQL 的 高 级 语言 称 为 主语 言 或 宿主 语言 。 
SQL 语言 在 这 两 种 方式 中 的 大 部 分 语法 是 相同 的 。 嵌 入 式 SQL 在 编写 访问 数据 库 的 
程序 时 ,必须 从 普通 的 编程 语言 开始 (如 C 语言 ) ,再 把 SQL 加 入 到 程序 中 。 所 以 ,嵌入 式 
SQL 语言 就 是 将 SQL 语句 直接 嵌入 到 程序 的 源 代码 中 ,与 其 他 程序 设计 语言 语句 混合 。 
专用 的 SQL 预 编 译 程序 将 嵌入 的 SQL 语句 转换 为 能 被 程序 设计 语言 (如 C 语言 ) 的 编译 器 
识别 的 函数 调用 。 然 后 ,C 编译 器 编译 源 代码 为 可 执行 程序 。 各 个 数据 库 厂 商都 采用 嵌入 
SQL 语言 ,并 且 都 符合 ANSI/ISO 的 标准 。 所 以 ,如 果 采 用 合适 的 嵌入 SQL 语言 ,那么 可 
以 使 得 程序 能 够 在 各 个 数据 库 平 台 上 执行 ,同时 ,每 个 数据 库 厂商 又 扩展 了 ANSI/ISO 的 
标准 ,提供 了 一 些 附加 的 功能 。 这 样 , 也 使 得 每 个 数据 库 产 品 在 嵌入 SQL 方面 有 一 些 区 别 。 


8.1.2 SQL 语言 和 宿主 语言 编程 
1. 嵌入 SQL 与 宿主 语言 编程 的 特点 


以 SQL Server 数据 库 和 C 语言 作为 宿主 语言 为 例 , 嵌 入 SQL 编程 的 基本 特点 如 下 : 
(1) 程序 的 开头 EXEC SQL INCLUDE SQLCA; 引 入 用 于 应 用 程序 和 数据 库 之 间 的 通 
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信 的 数据 结构 SQLCA。 在 SQLCA 中 的 SQLCODE 返回 SQL 语句 执行 后 的 结果 状态 。 根 
据 SQLCODE 判断 下 一 步 的 流程 。 SQLCODE 会 在 后 续 的 内 容 中 介绍 。 

(2) 在 BEGIN DECLARE SECTION 和 END DECLARE SECTION 之 间 定 义 了 宿主 
变量 。 宿 主 变量 可 被 SQL 语句 引用 ,也 可 以 被 C 语言 语句 引用 。 它 用 于 将 程序 中 的 数据 
通过 SQL 语句 传 给 数据 库 管理 器 ,或 从 数据 库 管 理 器 接收 查询 的 结果 。 

(3) 每 次 访问 数据 库 之 前 必须 进行 CONNECT 操作 ,连接 到 某 一 个 数据 库 上 。 这 时 ， 
应 该 保证 数据 库 服 务 及 实例 已 经 启动 。 

(4) 执行 语句 。 每 条 嵌入 式 SQL 语句 都 由 EXEC SQL 开始 ,表明 它 是 一 条 SQL 语句 。 
每 一 条 嵌入 SQL 语句 都 有 结束 符号 ,例如 在 C 语言 中 是 “; ”。 这 也 是 告诉 预 编译 器 在 
EXEC SQL 和 “; "之 间 是 嵌入 SQL 语句 。 

(5) 断 开 数 据 库 的 连接 。 

下 面 是 一 个 简单 的 嵌入 式 SQL 语言 的 程序 ,在 VC 下 需要 设置 项 目 导 入 sqlserver 安 
装 目录 下 的 sqlakw32. lib 和 caw32. lib 类 库 。 下 面 的 例子 将 演示 如 何在 嵌入 式 SQL 中 创 
建 表 , 插 入 数据 ,并 显示 数据 。student 表 结 构 如 表 8-1 所 示 。 


表 8-1 

字 段 名 类 型 约 束 
SNO char(5) 主键 
SNAME char(10) 

AGE int 

CTY char(10) 


【 例 8.1】 编写 嵌入 式 SQL 语言 程序 以 完成 创建 student 表 、 插 入 四 条 测试 数据 ,并 显 
示 学 生 的 全 部 信息 。 


# include < stdio.h> 
#include < stdlib.h> 
EXEC SQL INCLUDE sqlca; 
int main( ) 
{ 
EXEC SQL BEGIN DECLARE SECTION; 
// 主 变量 
char sno[5]; 
char sname[10]; 
int age; 
char city[10]; 
EXEC SQL END DECLARE SECTION; 
printf(" 这 是 一 个 髋 人 式 程序 的 测试 \n"); 
EXEC SQL CONNECT TO mysqlserver. school USER sa.abc; 
// 连 接 到 数据 库 , 其 中 computername 是 机 器 名 , school 是 数据 库 名 ， 
// 用 户 名 是 sa, 密码 是 abc 
if (SQLCODE = = 0) 
{ 
printf(" 连 接 数 据 库 "); 
} 


else 
// 连接 数据 库 错 误 
printf( "连接 数据 库 错误 "); 


return (1); 


// 执 行 创建 表 
EXEC SQL create table student ( 
sno char(5) primary key, 
sname char(10) not null, 
age int, 
city char(10) 
); 
// 执 行 插入 数据 
EXEC SQL insert into student values( 'S1', ' 张 三 ',20, ' 天 津 '); 
EXEC SQL insert into student values( 'S2', ' 李 四 ',10, ' 北 京 '); 
EXEC SQL insert into student values( 'S3', ' 王 五 ', 15, ' 天 津 '); 
EXEC SQL insert into student values( 'S4', ' 赵 六 ',20, ' 天 津 '); 
// 错 误 处 理 
EXEC SQL WHENEVER SQLERROR GOTO error; 
EXEC SQL WHENEVER NOT FOUND GOTO done; 
// 定 义 游标 
EXEC SQL DECLARE myclass CURSOR FOR 
SELECT sname, city FROM student; 


EXEC SQL OPEN myclass; 


for(;;){ 

/* 在 结果 集中 取出 下 一 行 */ 

EXEC SQL FETCH myclass INTO :sname, :city; 
/* 显示 数 据 * / 

printf ("sname: %s ",sname); 

printf ("城市 :% s\n",city); 

} 

error: // 错 误 处 理 代码 块 

// 打 印 出 错误 信息 

printf ("SQL error % d\n", sqlcode); 
done: 

/* 关闭 游标 */ 

EXEC SQL WHENEVER SQLERROR cont inue; 
EXEC SQL CLOSE myclass; 

// 断 开 连 接 

EXEC SQL DISCONNECT ALL; 

return 0; 


2. 常用 的 嵌入 SQL 语句 
表 8-2 所 示 为 常用 的 嵌入 式 SQL 语句 。 
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表 8-2 常用 的 嵌入 式 SQL 语句 

关 键 字 
BEGIN DECLARE SECTION 
CLOSE 
CONNECT TO 
DECLARE CURSOR 
DELETE (POSITIONED) 
DELETE (SEARCHED) 
DESCRIBE 
DISCONNECT 
END DECLARE SECTION 


PREPARE 

SELECT INTO 

SET ANSL DEFAULTS 

SET CONCURRENCY 

SET CONNECTION 

SET CURSOR_CLOSE_ON_COMMIT 
SET CURSORTYPE 

SET FETCHBUFFER 

SET OPTION 


EXECUTE SET SCROLLOPTION 
EXECUTE IMMEDIATE UPDATE (POSITIONED) 
FETCH UPDATE (SEARCHED) 
GET CONNECTION WHENEVER 

OPEN 


部 分 语句 将 在 本 章 后 面 做 介绍 。 骨 入 式 SQL 语句 分 为 静态 SQL 语句 和 动态 SQL 语 
句 两 类 。 静 态 SQL 语句 在 编译 时 已 经 生成 执行 计划 。 而 动态 SQL 语句 只 有 在 执行 时 才 产 
生 执 行 计划 。 动 态 SQL 语句 首先 执行 PREPARE 语句 要 求 数据 库 管理 系统 分 析 、 确 认 和 
优化 语句 ,并 为 其 生成 执行 计划 。 


8.1.3 静态 SQL 编程 
1. 声明 变量 


主 变量 就 是 在 嵌入 式 SQL 语句 中 引用 主语 言 中 说 明 的 程序 变量 。 声 明 柑 入 SQL 语句 
中 使 用 的 C 变量 , 它 的 声明 方法 如 下 : 
EXEC SQL BEGIN DECLARE SECTION; 
char first_name[50]; 


char last_name[ ] = "White"; 
EXEC SQL END DECLARE SECTION; 


EXEC SQL SELECT au_fname INTO :first_name 
from authors where au_ lname = :last name; 


在 能 入 式 SQL 语句 中 使 用 主 变量 前 ,必须 采用 BEGIN DECLARE SECTION 和 END 
DECLARE SECTION 对 主 变量 进行 说 明 。 这 两 条 语句 不 是 可 执行 语句 ,而 是 预 编 译 程序 
的 说 明 。 主 变量 是 标准 的 C 程序 变量 。 骨 入 SQL 语句 使 用 主 变量 来 输入 数据 和 输出 数 
据 。C 程序 和 嵌入 SQL 语句 都 可 以 访问 主 变量 。 

在 以 SQL 为 基础 的 DBMS 支持 的 数据 类 型 与 程序 设计 语言 支持 的 数据 类 型 之 间 有 很 
大 差别 。 这 些 差 别 对 主 变量 影响 很 大 。 一 方面 , 主 变量 是 一 个 用 程序 设计 语言 的 数据 类 型 
说 明 并 用 程序 设计 语言 处 理 的 程序 变量 ; 另 一 方面 ,在 嵌入 SQL 语句 中 用 主 变量 保存 数据 
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库 数 据 。 所 以 ,在 嵌入 SQL 语句 中 ,必须 映射 C 数据 类 型 为 合适 的 SQL Server 数据 类 型 。 
必须 慎重 选择 主 变量 的 数据 类 型 。 在 SQL SERVER 中 ,大 多 数 数据 类 型 都 能 够 自动 转换 。 
具体 内 容 请 参看 SQL Server 帮助 文档 。 


2. 连接 数据 库 
在 程序 中 ,使 用 CONNECT TO 语句 来 连接 数据 库 。 该 语句 的 完整 语法 为 : 


CONNECT TO {[ server name.] database name} [AS connection _ name] USER [login[. password] | 
$ integrated] 
其 中 ; 
。 server_name 为 服务 器 名 。 如 省 略 , 则 为 本 地 服务 器 名 。 
。 database_name 为 数据 库 名 。 
。 connection_name 为 连接 名 。 可 省 略 。 如 果 仅 仅 使 用 一 个 连接 ,那么 无 须 指 定 连接 
名 。 可 以 使 用 SET CONNECTION 来 使 用 不 同 的 连接 。 
login 为 登录 名 。 
password 为 密码 。 
在 "EXEC SQL CONNECT TO mysqlserver. pubs USER sa. abc;” 中 ,服务 器 是 mysqlserver， 
数据 库 为 pubs ,登录 名 为 sa, 密 码 为 abc。 


3. 数据 操作 


可 以 使 用 SELECT INTO 语句 查询 数据 ,并 将 数据 存放 在 主 变量 中 。 请 看 下 面 的 例子 : 


EXEC SQL SELECT SNAME INTO :student_ name 
FROM student WHERE CITY = :student city; 


使 用 DELETE 语句 删除 数据 。 其 语法 类 似 于 Transact-SQL 中 的 DELETE 语 法。 如: 
EXEC SQL DELETE FROM student WHERE sname = ' 张 三 ' 


使 用 UPDATE 语句 可 以 更 新 数据 。 其 语法 就 是 Transact-SQL 中 的 UPDATE 语 
法 。 如 : 


EXEC SQL UPDATE student SET age = age+ 1 WHERE sname = ' 李 四 ' 


使 用 INSERT 语句 可 以 插入 新 数据 。 其 语法 就 是 Transact-SQL 中 的 INSERT 语 
法 。 如 : 


EXEC SQL INSERT INTO student VALUES( 'S4', ' 赵 六 ',20, ' 天 津 '); 


以 上 介绍 的 是 单行 数据 的 调用 方法 ,多 行 数据 的 查询 和 修改 需要 用 到 本 节 第 5 部 分 介 
绍 的 游标 。 


4. SOLCA 


应 用 程序 执行 时 ,每 执行 一 条 SQL 语句 ,就 返回 一 个 状态 符 和 一 些 附加 信息 。 这 些 信 
息 反映 了 SQL 语句 的 执行 情况 , 它 有 助 于 用 户 分 析 应 用 程序 的 错误 所 在 。 这 些 信 息 都 存放 
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在 sqlca.h 的 sqlca 结构 中 。 如 果 一 个 源 文件 中 包含 SQL 语句 , 则 必须 要 在 源 程序 中 定义 
一 个 SQLCA 结构 ,而 且 名 为 SQLCA。 预 编译 器 自动 在 嵌入 SQL 语句 中 包含 SQLCA 数 
据 结构 。 在 程序 中 可 以 使 用 EXEC SQL INCLUDE SQLCA, 目 的 是 告诉 SQL 预 编译 程序 
在 该 程序 中 包含 一 个 SQL 通信 区 。 也 可 以 不 写 ,系统 会 自动 加 上 SQLCA 结构 。 

SQLCODE 是 结构 体 SQLCA 的 一 个 数据 分 量 。DBMS 是 SQL 的 通讯 区 即 SQLCA 
向 应 用 程序 报告 运行 错误 信息 。SQLCA 是 一 个 含有 错误 变量 和 状态 指示 符 的 数据 结构 。 
通过 检查 SQLCA ,应 用 程序 能 够 检查 出 嵌入 式 SQL 语句 是 否 成 功 ,并 根据 成 功 与 否决 定 是 
否 继续 往 下 执行 。 

SQLODE 是 结构 体 SQLCA 的 一 个 数据 分 量 , 也 是 SQLCA 结构 中 最 重要 的 部 分 在 执 
行 每 条 嵌入 式 SQL 语句 时 ,DBMS 在 SQLCA 中 设置 变量 SQLCODE 值 ,以 指明 语句 的 完 

。 二 0, 该 语句 成 功 执行 ,无 任何 错误 或 报警 。 

。 二 0, 出 现 了 严重 错误 。 

。 二 0, 出 现 了 报警 信息 。 
编程 过 程 中 ,要 随时 通过 判断 SQL 语句 的 执行 返回 值 来 决定 下 一 步 的 流程 。 


5. 游标 的 使 用 


用 骨 入 式 SQL 语句 查询 数据 分 为 两 类 情况 : 一 类 是 单行 结果 ,一 类 是 多 行 结果 。 对 于 
单行 结果 ,可 以 使 用 SELECT INTO 语句 ; 对 于 多 行 结果 , 则 必须 使 用 cursor 即 游标 来 完 
成 。 游 标 是 一 个 与 SELECT 语句 相关 联 的 符号 名 , 它 使 用 户 可 逐 行 访问 由 SQL Server 返 
回 的 结果 集 。 使 用 游标 时 ,需要 按照 以 下 步骤 进行 : 

@ 声明 游标 : 

如 : EXEC SQL DECLARE C1 CURSOR FOR 

SELECT id, name, dept, job, years, salary, comm FROM staff; 

@ 打开 游标 


如 : EXEC SQL OPEN cl; 

完整 语法 为 : 

OPEN 游标 名 [USING 主 变量 名 | DESCRIPTOR 描述 名 ] 

关于 动态 OPEN 游标 的 描述 见 8. 1. 4 节 动 态 SQL 编程 。 

@ 取 一 行 值 

如 : EXEC SQL FETCH cl INTO :id, :name, :dept, :job, :years, :salary, :comm; 

关于 动态 FETCH 语句 见 8.4 节 。 

@ 关闭 游标 

如 : EXEC SQL CLOSE c1; 

关闭 游标 的 同时 ,会 释放 由 游标 添加 的 锁 和 放弃 未 处 理 的 数据 。 在 关闭 游标 前 ,该 游标 
必须 已 经 声明 和 打开 。 另 外 ,程序 终止 时 ,系统 会 自动 关闭 所 有 打开 的 游标 。 

【 例 8.2】 编写 嵌入 式 SQL 语言 程序 ,完成 逐 行 打印 staff 表 中 的 全 部 记录 ,显示 的 列 
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包括 i1d、name、dept、job、years、salary 和 comm 字段 。 


// 声 明 游标 
EXEC SQL DECLARE Cl CURSOR FOR 
SELECT id, name, dept, job, years, salary, comm FROM staff; 
// 打 开 游 标 
EXEC SQL OPEN c1; // 打 开 游 标 
// 成 功 获取 到 游标 
while (SQLCODE = = 0) 
{ 
// 取 出 游标 的 数据 
EXEC SQL FETCH cl INTO :id, :name, :dept, :job, :years, :salary, :comm; 
// 如 果 成 功 取出 
if (SQLCODE = = 0) 
printf("% 4d %12s %10d %10s %2d %8d %8d", 
id，name，dept，job，years，salary，comm); // 打 印 各 个 变量 
} 
// 关 闭 游标 
EXEC SQL CLOSE c1; 


从 上 面 的 例子 可 以 看 出 ,首先 需要 定义 游标 结果 集 , 即 定义 该 游标 的 SELECT 语句 返 
回 的 行 的 集合 。 然 后 ,使 用 FETCH 语句 逐 行 处 理 。 值 得 注意 的 是 , 帜 入 SQL 语句 中 的 游 
标定 义 选项 同 Transact-SQL 中 的 游标 定义 选项 有 些 不 同 , 必 须 遵 循 嵌入 SQL 语句 中 的 游 

多 行 删除 也 可 以 使 用 UPDATE 语句 和 DELETE 语句 来 更 新 或 删除 由 游标 选择 的 当 
前 行 。 使 用 DELETE 语句 删除 当前 游标 所 在 的 行 数据 的 具体 语法 如 下 : 


DELETE [FROM] {table name | view_name} WHERE CURRENT OF cursor_name 


其 中 : 
。 table_name 是 表 名 ,该 表 必须 是 DECLARE CURSOR 中 SELECT 语句 中 的 表 。 
。 view_name 是 视图 名 ,该 视图 必须 是 DECLARE CURSOR 中 SELECT 语句 中 的 
视图 。 
。 cursor_name 是 游标 名 。 
【 例 8.3】 编写 嵌入 式 SQL 语言 程序 , 逐 行 显示 authors 表 中 的 firstname 和 lastname, 并 
询问 用 户 是 否 删 除 该 信息 ,如 果 回 答 “是 ”, 那 么 删除 当前 行 的 数据 。 


EXEC SQL DECLARE cl CURSOR FOR 
SELECT au_fname, au_ lname FROM authors; 
EXEC SQL OPEN cl1; 


while (SQLCODE = = 0) 

{ 
EXEC SQL FETCH cl INTO :fname, :lname; 
if (SQLCODE = = 0) 


{ 
printf("%12s %12s\n", fname, lname); 
printf("Delete? "); 
scanf("%c", &reply); 


if (reply = = 'y') 

t 
EXEC SQL DELETE FROM authors WHERE CURRENT OF cl1; 
printf("delete sqlcode= $%d\n", SQLCODE(ca)); 


} 


6. 错误 处 理 


在 每 条 嵌 和 人 式 SQL 语句 之 后 立即 编写 一 条 检查 SQLCODE 值 的 程序 ,是 一 件 很 烦琐 
的 事情 。 为 了 简化 错误 处 理 , 可 以 使 用 WHENEVER 语句 。 该 语句 是 SQL 预 编译 程序 的 
指示 语句 ,而 不 是 可 执行 语句 。 它 通知 预 编译 程序 在 每 条 可 执行 嵌入 式 SQL 语句 之 后 自动 
生成 错误 处 理 程序 ,并 指定 了 错误 处 理 操作 。 
用 户 可 以 使 用 WHENEVER 语句 通知 预 编 译 程序 去 进行 三 种 异常 处 理 : 
(1) WHENEVER SQLERROR action: 表示 一 旦 SQL 语句 执行 时 遇 到 错误 信息 ,如 
SQLCODE 一 0 则 执行 action ,action 中 包含 了 处 理 错 误 的 代码 。 

(2) WHENEVER SQLWARNING action: 表示 一 旦 SQL 语句 执行 时 遇 到 警告 信息 ， 
则 执行 action, 即 action 中 包含 了 处 理 警 报 的 代码 (SQLCODE=1) 。 

(3) WHENEVER NOT FOUND: 表示 一 旦 SQL 语句 执行 时 没有 找到 相应 的 元 组 , 则 
执行 action, 即 action 包含 了 处 理 没 有 查 到 内 容 的 代码 (SQLCODE 王 100) 。 

针对 上 述 三 种 异常 处 理 , 用 户 可 以 指定 预 编译 程序 采取 以 下 三 种 行为 : 

(1) WHENEVER …GOTO: 通知 预 编译 程序 产生 一 条 转移 语句 。 

(2) WHENEVER…CONTINUE: 通知 预 编译 程序 让 程序 的 控制 流转 入 到 下 一 个 主 
语言 语句 。 

(3) WHENEVER…CALL: 通知 预 编译 程序 调用 函数 。 

其 完整 语法 如 下 : 

WHENEVER {SQLWARNING | SQLERROR | NOT FOUND} {CONTINUE | GOTO stmt_label | CALL function( )} 


【 例 8.4】 编写 嵌入 式 SQL 语言 程序 ,利用 WHENEVER 进行 不 同 的 错误 处 理 。 


EXEC SQL WHENEVER sqlerror GOTO errormessagel; 
EXEC SQL DELETE FROM homesales 
WHERE equity < 10000; 
EXEC SQL DELETE FROM customerlist 
WHERE salary < 40000; 
EXEC SQL WHENEVER sqlerror CONTINUE; 
EXEC SQL UPDATE homesales 
SET equity = equity — loanvalue; 
EXEC SQL WHENEVER sqlerror GOTO errormessage2; 
EXEC SQL INSERT INTO homesales (seller name, sale price) 
VALUES( 'Jane Doe'，180000.00); . 
errormessagel : 
printf( "SQL DELETE error: %ld\n, sqlcode); 
exit(); 


erTormessage2 : 
printf("SQL INSERT error: %1ld\n, sqlcode); 
exit(); 
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WHENEVER 语句 使 得 对 嵌入 式 SQL 错误 的 处 理 更 加 简便 。 应 该 在 应 用 程序 中 普遍 


使 用 ,而 不 是 直接 检查 SQLCODE 的 值 。 
8.1.4 动态 SOL 编程 


前 一 节 中 讲述 的 戏 入 SQL 语言 都 是 静态 SQL 语言 , 即 在 编译 时 已 经 确定 了 要 引用 的 
表 和 列 。 主 变量 不 改变 表 和 列 信息 。 在 上 几 节 中 ,使 用 主 变量 改变 查询 参数 ,但 是 不 能 用 主 


变量 代替 表 名 或 列 名 。 和 否则 ,系统 报错 。 动 态 SQL 语句 就 是 来 解决 这 个 问题 。 


动态 SQL 语句 的 目的 是 ,不 是 在 编译 时 确定 SQL 的 表 和 列 ,而 是 让 程序 在 运行 时 提 
供 ,并 将 SQL 语句 文本 传 给 DBMS 执行 。 按 照 功 能 和 处 理 上 的 划分 ,动态 SQL 应 该 分 成 


两 类 来 解释 : 动态 修改 和 动态 查询 , 即 动态 游标 。 
1. 动态 修改 


动态 修改 使 用 PREPARE 语句 和 EXECUTE 语句 。PREPARE 语句 是 动态 SQL 语句 


独 有 的 语句 。 其 语法 为 : 


PREPARE 语句 名 FROM 主 变量 


该 语句 接收 含有 SQL 语句 串 的 主 变量 ,并 把 该 语句 送 到 DBMS。DBMS 编译 语句 并 生 
成 执行 计划 。 在 语句 串 中 包含 一 个 “?” 表 明 参 数 , 当 执行 语句 时 ,DBMS 需要 参数 来 替代 这 
些 *?”。PREPARE 执行 的 结果 是 ,DBMS 把 语句 名 赋 给 准备 的 语句 。 语 句 名 类 似 于 游标 
名 ,是 一 个 SQL 标识 符 。 在 执行 SQL 语句 时 ,EXECUTE 语句 后 面 是 这 个 语句 名 。 

【 例 8.5】 编写 嵌入 式 SQL 语言 程序 ,利用 游标 ,向 books 表 中 插入 数据 。 


EXEC SQL BEGIN DECLARE SECTION; 


char prep[] = "INSERT INTO books VALUES(?,?,?)"; 
char bookname[ 30]; 

char author[30]; 

int num; 


EXEC SQL END DECLARE SECTION; 
EXEC SQL PREPARE prep_stat FROM :prep; 
while (SQLCODE = = 0) 
{ 
strcpy(bookname,"C 编程 " ); 
strcpy(author," 张 三 "); 
num = 10; 


EXEC SQL EXECUTE prep_stat USING : bookname, : author, : 


} 


在 例 8.5 中 ,prep_stat 是 语句 名 ,prep 主 变 量 的 值 是 一 个 INSERT 语句 ,包含 了 三 个 


参数 (3 个 “?”)。PREPARE 的 作用 是 : DBMS 编译 这 个 语句 并 4 


赋 给 这 个 准备 的 语句 。 


成 执行 计划 ,并 把 语句 名 
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值得 注意 的 是 ,PREPARE 中 的 语句 名 的 作用 范围 为 整个 程序 ,所 以 不 允许 在 同一 个 程 
序 中 将 相同 的 语句 名 用 在 多 个 PREPARE 语句 中 。EXECUTE 语句 是 动态 SQL 独 有 的 语 
句 。 它 的 语法 如 下 : 


EXECUTE 语句 名 USING 主 变量 | DESCRIPTOR 描述 符 名 


例 8.5 中 的 “EXEC SQL EXECUTE prep_stat USING : bookname，: author，: 
num; "语句 的 作用 是 ,请求 DBMS 执行 PREPARE 语句 准备 好 的 语句 。 当 要 执行 的 动态 语 
句 中 包含 一 个 或 多 个 参数 标志 时 ,在 EXECUTE 语句 中 必须 为 每 一 个 参数 提供 值 , 如 
:bookname :author 和 :num。 这 样 的 话 ,EXECUTE 语句 用 主 变量 值 逐 一 代替 准备 语句 中 
的 参数 标志 (*?”) ,从 而 为 动态 执行 语句 提供 了 输入 值 。 需 要 注意 的 是 ,USING 子 句 中 的 主 
变量 数 必须 同 动态 语句 中 的 参数 标志 数 一 致 ,而 且 每 一 个 主 变量 的 数据 类 型 必须 同 相应 参 
数 所 需 的 数据 类 型 相 一 致 。 


2. 动态 查询 


游标 分 为 静态 游标 和 动态 游标 两 类 。 对 于 静态 游标 ,在 定义 游标 时 就 已 经 确定 了 完整 
的 SELECT 语句 。 在 SELECT 语句 中 可 以 包含 主 变量 来 接收 输入 值 。 当 执行 游标 的 
OPEN 语句 时 , 主 变量 的 值 被 放 入 SELECT 语句 。 在 OPEN 语句 中 ,不 用 指定 主 变 量 , 因 
为 在 DECLARE CURSOR 语句 中 已 经 放置 了 主 变量 。 

动态 游标 和 静态 游标 不 同 。 以 下 是 动态 游标 使 用 的 步骤 。 

【 例 8.6】 编写 嵌入 式 SQL 语言 程序 ,对 author 表 的 进行 动态 查询 。 


EXEC SQL BEGIN DECLARE SECTION; 
char SzLastName[] = "White"; 
char szFirstName[30]; 
EXEC SQL END DECLARE SECTION; 
EXEC SQL 
DECLARE author_cursor CURSOR FOR 
SELECT au_fname FROM authors WHERE au_lname = :szLastName; 
EXEC SQL OPEN author_ cursor; 
EXEC SQL FETCH author_cursor INTO :szFirstName; 


动态 游标 和 静态 游标 不 同 。 以 下 是 动态 游标 使 用 的 过 程 : 

声明 游标 : 

对 于 动态 游标 ,在 DECLARE CURSOR 语句 中 不 包含 SELECT 语句 ,而 是 定义 在 
PREPARE 中 的 语句 名 ,用 PREPARE 语句 规定 与 查询 相关 的 语句 名 称 。 

@ 打开 游标 

完整 语法 为 : 

OPEN 游标 名 [USING 主 变 量 名 | DESCRIPTOR 描述 名 ] 

在 动态 游标 中 ,OPEN 语句 的 作用 是 使 DBMS 在 第 一 行 查 询 结 果 前 开始 执行 查询 并 定 
位 相关 的 游标 。 当 OPEN 语句 成 功 执行 完毕 后 ,游标 处 于 打开 状态 ,并 为 FETCH 语句 做 
准备 。OPEN 语句 执行 一 条 由 PREPARE 语句 预 编译 的 语句 。 如 果 动 态 查 询 正文 中 包含 
有 一 个 或 多 个 参数 标志 时 .OPEN 语句 必须 为 这 些 参数 提供 参数 值 。USING 子 句 的 作用 是 
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FETCH 语法 为 : 
FETCH 游标 名 USING DESCRIPTOR 描述 符 名 


动态 FETCH 语句 的 作用 是 ,把 这 一 行 的 各 列 值 送 到 SQLDA 中 ,并 把 游标 移 到 下 一 行 
注意 而 静态 FETCH 语句 的 作用 是 用 主 变 量 表 接 收 查询 到 的 列 值 。 

在 使 用 FETCH 语句 前 ,必须 为 数据 区 分 配 空间 ,SQLDATA 字段 指向 检索 出 的 数据 
区 。SQLLEN 字段 是 SQLDATA 指向 的 数据 区 的 长 度 。SQLIND 字段 指出 是 否 为 
NULE. 

@ 关闭 游标 

完整 语法 为 : 

EXEC SQL CLOSE 游标 名 


和 关闭 静态 游标 一 样 ,也 会 释放 由 游标 添加 的 锁 和 放弃 未 处 理 的 数据 。 

在 动态 游标 的 DECLARE CURSOR 语句 中 不 包含 SELECT 语句 ,而 是 定义 了 在 
PREPARE 中 的 语句 名 ,用 PREPARE 语句 规定 与 查询 相关 的 语句 名 称 。 如 果 PREPARE 
语句 中 的 语句 包含 了 参数 ,那么 在 OPEN 语句 中 必须 指定 提供 参数 值 的 主 变量 或 SQLDA。 
动态 DECLARE CURSOR 语句 是 SQL 预 编译 程序 中 的 一 个 命令 ,而 不 是 可 执行 语句 。 该 
子 句 必须 在 OPEN FETCH CLOSE 语句 之 前 使 用 。 

【 例 8.7】 编写 嵌入 式 SQL 语言 程序 ,完成 author 表 的 动态 查询 。 

EXEC SQL BEGIN DECLARE SECTION; 

char szCommand[ ] = "SELECT au fname FROM authors WHERE au_ lname = ?"; 

char szLastName[] = "White"; 


char szFirstName[30]; 
EXEC SQL END DECLARE SECTION; 


EXEC SQL DECLARE author_cursor CURSOR FOR select_statement; 
EXEC SQL PREPARE select_statement FROM :szCommand; 
EXEC SQL OPEN author_cursor USING :szLastName; 


EXEC SQL FETCH author_cursor INTO :szFirstName; 


3. SOLDA 


动态 SQL 语句 在 编译 时 可 能 不 知道 有 多 少 列 信息 。 在 嵌入 SQL 语句 中 ,这 些 不 确定 
的 数据 是 通过 SQLDA 完成 的 。SQLDA 的 结构 非常 灵活 ,在 该 结构 的 固定 部 分 ,指明 了 多 
少 列 等 信息 ,在 该 结构 的 后 面 有 一 个 可 变 长 的 结构 ,说 明 每 列 的 信息 。 在 从 数据 库 获 得 数据 
时 ,就 可 以 采用 SQLDA 来 获得 每 行 的 数据 。 各 个 数据 库 产品 的 SQLDA 结构 都 不 完全 相 
同 。 可 以 通过 SQLDA 为 嵌入 SQL 语句 提供 输入 数据 和 从 嵌入 SQL 语句 中 输出 数据 。 理 
解 SQLDA 的 结构 是 理解 动态 SQL 的 关键 。 关 于 SQLDA 的 具体 内 容 请 参看 SQL Server 
的 帮助 。 


6.2 存储 过 程 


8.2.1 存储 过 程 概述 


1. 存储 过 程 的 概念 和 分 类 


存储 过 程 是 一 组 用 来 完成 某 种 特定 功能 的 Transact-SQL 语句 集合 ,这 组 SQL 语句 经 
过 预 编译 后 存储 在 数据 库 中 ,可 以 在 SQL Server 中 或 前 端 应 用 程序 中 对 其 进行 调用 。 可 以 
说 存储 过 程 是 在 数据 库 端 执行 的 Transact-SQL 程序 , 它 主 要 用 于 实现 需要 频繁 使 用 的 查 
询 。 存 储 过 程 可 以 接收 输入 参数 并 以 返回 参数 的 形式 向 调用 过 程 返回 值 。 

在 SQL Server 中 ,存储 过 程 主要 分 为 两 大 类 : 系统 存储 过 程 和 用 户 自 定义 存储 过 程 。 
系统 存储 过 程 由 SQL Server 自动 创建 并 存储 在 master 数据 库 中 ,其 名 称 都 以 sp_ 为 前 级 。 
管理 员 可 以 通过 SQL Server 提供 的 系统 存储 过 程 进行 管理 性 和 信息 性 的 工作 ,如 查看 数据 
库 的 相关 信息 .目录 管理 .配置 和 管理 日 志 , 安 全 性 管理 等 ,它们 中 的 大 部 分 可 以 在 用 户 数据 
库 中 使 用 。 用 户 自 定义 存储 过 程 是 由 用 户 为 完成 某 一 特定 功能 所 创建 的 存储 过 程 ,本 章 内 
容 所 涉及 的 主要 是 用 户 自 定义 的 存储 过 程 。 


2. 存储 过 程 的 优点 


在 创建 SQL Server 应 用 程序 时 ,TransactrSQL 是 应 用 程序 与 SQL Server 数据 库 之 间 
主要 的 编程 接口 。 在 实际 操作 中 , 既 可 以 创建 本 地 存储 的 Transact-SQL 程序 ,通过 向 SQL 
Server 发 送 命令 并 处 理 结果 ,也 可 以 将 TransactrSQL 程序 作为 存储 过 程 存储 在 SQL 
Server 中 ,并 创建 应 用 程序 调用 存储 过 程 ,再 对 数据 结果 进行 相应 处 理 。 两 种 方法 比较 起 
来 ,后 者 具有 一 些 显著 的 优点 。 

(1) 增强 代码 的 可 重用 性 和 共享 性 

存储 过 程 只 需 创 建 一 次 并 存储 在 数据 库 中 ,就 可 以 在 程序 中 反复 被 调用 ,还 可 以 被 多 个 
用 户 所 共享 。 那些 经 常 执行 的 查询 操作 可 以 写成 存储 过 程 ,这 样 就 避免 了 在 程序 中 反复 编 
写 ,提高 了 开发 的 效率 和 质量 。 

(2) 执行 速度 快 

存储 过 程 是 预 编译 的 ,在 第 一 次 执行 一 个 存储 过 程 时 ,系统 会 对 其 进行 分 析 和 优化 ,并 
将 经 过 编译 的 存储 过 程 保存 在 高 速 缓存 中 ,以 后 执行 同一 个 存储 过 程 时 便 无 须 再 次 进行 编 
译 , 从 而 加 快 了 其 执行 速度 。 

(3) 减少 网 络 流量 

存储 过 程 存 放 在 服务 器 端 , 客 户 端 应 用 程序 需要 使 用 存储 过 程 时 ,网 络 中 只 需 传 送 对 存 
储 过 程 进 行 调用 的 语句 ,而 无 须 传送 大 段 的 TransactSQL 代码 ,可 以 减少 网 络 上 的 流量 。 

(4) 增强 安全 性 
可 以 将 执行 存储 过 程 的 权限 赋予 某 些 用 户 而 不 将 对 数据 表 的 直接 访问 权限 授予 他 们 ， 
这 样 用 户 只 能 通过 存储 过 程 来 访问 和 操作 表 中 的 数据 ,从 而 保证 了 数据 的 安全 性 。 
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8.2.2 创建 和 执行 存储 过 程 


可 以 用 CREATE PROCEDURE 语句 和 EXECUTE 语句 来 创建 和 执行 存储 过 程 ,也 可 
以 在 SQL Server 企业 管理 器 中 完成 创建 存储 过 程 的 操作 。 

创建 存储 过 程 的 语法 如 下 : 

CREATE PROC [ EDURE ] procedure name [ ; number ] 

[ { @parameter data type } 

[ VARYING ] [ = default ] [ OUTPUT ] ] [ ，..n] 

[ WITH 

{ RECOMPILE | ENCRYPTION | RECOMPILE , ENCRYPTION } ] 

[ FOR REPLICATION ] 

RS sql_statements 


以 上 语法 中 包含 的 主要 参数 说 明 如 下 : 

procedure_name: 所 创建 的 存储 过 程 的 名 称 ,存储 过 程 的 命名 必须 遵循 标识 符 规则 且 
在 同一 个 数据 库 中 必须 唯一 。 

; number: 可 选 整数 ,用 来 对 同名 的 过 程 分 组 ,以 便 用 一 条 DROP PROCEDURE 语句 
即 可 将 同 组 过 程 删除 。 

@parameter: 存储 过 程 中 的 参数 ,在 一 个 存储 过 程 可 以 没有 参数 ,也 可 以 指定 一 个 或 
多 个 参数 。 使 用 符号 @ 作 为 第 一 个 字符 来 指定 参数 名 称 , 参 数 命名 必须 符合 标识 符 的 规则 ， 
而 且 符号 @ 和 参数 名 之 间 不 能 有 空格 。 存 储 过 程 最 多 可 以 有 2100 个 参数 ,在 默认 情况 下 ， 
参数 只 能 代替 常量 ,而 不 能 用 于 代替 表 名 、 列 名 或 其 他 数据 库 对 象 的 名 称 。 

data_type: 指定 参数 的 数据 类 型 。 可 以 使 用 除 table 之 外 任何 一 种 SQL Server 所 提供 
的 数据 类 型 来 定义 参数 ,同样 也 可 以 使 用 用 户 自 定 义 类 型 。 参 数 的 数据 类 型 确定 了 该 参数 
所 接受 值 的 类 型 和 范围 ,如 果 执 行 存储 过 程 时 所 使 用 的 值 与 参数 的 数据 类 型 不 兼容 ,就 会 出 
现 错误 。 

VARYING: 指定 作为 输出 参数 支持 的 结果 集 。 

三 default: 参数 的 默认 值 。 如 果 定 义 了 默认 值 , 则 在 调用 时 不 必 指 定 该 参数 的 值 即 可 
执行 存储 过 程 。 默 认 值 必须 是 常量 或 NULL。 如 果 对 该 参数 使 用 LIKE 关键 字 ,那么 默认 
值 中 可 以 包含 通配符 。 

OUTPUT: 表示 参数 为 返回 参数 ,使 用 OUTPUT 参数 可 将 信息 返回 给 调用 过 程 。 

RECOMPILE: 表示 SQL Server 不 保存 该 存储 过 程 的 执行 计划 ,每 次 执行 都 要 重新 
编译 。 

ENCRYPTION: 表示 SQL Server 加 密 syscomments 表 中 包含 CREATE 
PROCEDURE 语句 文本 。 存 储 过 程 一 旦 加 密 , 其 定义 即 无 法 解密 ,即使 是 存储 过 程 的 所 有 
者 或 系统 管理 员 也 将 无 法 查看 存储 过 程 定义 。 

FOR REPLICATION: 指定 不 能 在 订阅 服务 器 上 执行 为 复制 创建 的 存储 过 程 。 使 
FOR REPLICATION 选项 创建 的 存储 过 程 可 用 作 存 储 过 程 筛选 , 且 只 能 在 复制 过 程 中 执 
行 。 本 选项 不 能 和 WITH RECOMPILE 选项 一 起 使 用 。 

AS: 指定 过 程 要 执行 的 操作 。 


160 


SA 


数据 库 原理 


sql_statement: 存储 过 程 中 包含 的 任意 数目 和 类 型 的 TransactrSQL 语句 。 

在 创建 存储 过 程 时 还 应 该 注意 不 能 将 CREATE PROCEDURE 与 其 他 SQL 语句 组 合 
到 一 个 批 处 理 中 。 在 CREATE PROCEDURE 定义 中 不 能 出 现 几 种 CREATE 语句 ,包括 
CREATE DEFAULT、CREATE PROCEDURE. CREATE RULE、CREATE TRIGGER 
和 CREATE VIEW, 但 可 以 在 过 程 中 创建 其 他 的 数据 库 对 象 。 此 外 ,只 能 在 当前 数据 库 中 
创建 存储 过 程 。 

关于 CREATE PROCEDURE 的 实际 使 用 ,将 在 后 面 的 例子 中 进行 详细 说 明 。 

执行 存储 过 程 使 用 EXECUTE 语句 ,具体 语法 如 下 : 


EXEC [ UTE ] ] 


{ 
[ @return status = ] 

{ procedure name [ ;number ] | @procedure name var 
} 
[ @parameter = ] { value | @variable [ OUTPUT ] | [ DEFAULT ] ] 
| 

WITH RECOMPILE ] 


参数 说 明 如 下 : 
@return_status: 一 个 可 选 的 整 型 变量 ,保存 存储 过 程 的 返回 状态 。 
procedure_name: 要 进行 调用 的 存储 过 程 的 名 称 。 

@procedure_name_var: 局 部 定义 变量 名 ,代表 存储 过 程 名 称 。 

@parameter: 存储 过 程 参 数 , 与 前 面 在 CREATE PROCEDURE 语句 中 定义 的 相 
一 致 。 

value: 存储 过 程 中 参数 的 值 。 

@variable: 用 来 保存 参数 或 者 返回 参数 的 变量 。 

OUTPUT: 指定 存储 过 程 必须 返回 一 个 参数 。 使 用 OUTPUT 参数 ,目的 是 在 调用 存 
储 过 程 的 其 他 语句 中 使 用 其 返回 值 , 参 数值 必须 作为 变量 传递 。 

下 面 通过 几 个 简单 的 例子 ,对 上 述 创建 和 执行 存储 过 程 的 语法 的 使 用 进行 说 明 。 

【 例 8.8】 创建 存储 过 程 ,返回 Customers 表 中 所 有 客户 的 CustomerID、CompanyName、 
Address 和 Phone 等 信息 。 


CREATE PROCEDURE Customerinfo 
RS 

SELECT CustomerID, CompanyName, Address, Phone FROM Customers; 
G0 


例 8.8 中 没有 任何 参数 ,其 中 的 SQL 语句 也 非常 简单 ,实际 应 用 中 可 能 很 少 会 有 如 此 
简单 的 存储 过 程 ,但 从 中 可 以 看 到 创建 存储 过 程 最 基本 的 形式 。 存 储 过 程 中 的 SQL 语句 可 
以 非常 复杂 ,在 设计 的 时 候 可 以 先 单独 编写 和 测试 SQL 语句 ,确定 符合 要 求 之 后 再 按照 存 
储 过 程 的 语法 来 进行 定义 。 

要 执行 例 8. 8 中 的 存储 过 程 可 采用 以 下 语句 : 


EXEC Customerinfo; 


行 


按 
的 
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【 例 8.9】 创建 带 有 输入 参数 的 存储 过 程 ,实现 返回 某 一 客户 曾经 购买 过 的 产品 以 及 
种 商品 的 数量 。 


CREATE PROCEDURE CustomerProducts (@CustomerID nchar(5) 
RS 

SELECT ProductName, Total = SUM(Quantity) 

FROM Products P, [Order Details] OD, Orders 0, Customers C 

WHERE C. CustomerID = (@CustomerID 

AND C. CustomerID = 0. CustomerID AND 0. OrderID = 0D. OrderID AND OD. ProductID = 

P. ProductID 

GROUP BY ProductName 
GO 


执行 这 个 存储 过 程 时 ,需要 将 CustomerID 作为 参数 给 出 : 
EXEC CustomerProducts @CustomerID = 'ALFKI'; 


结果 将 返回 CustomerID 为 ALFKI 的 客户 所 购买 过 的 产品 及 数量 。 
【 例 8.10】 编写 存储 过 程 ,实现 在 Customers 表 中 增加 一 个 新 的 客户 。 


CREATE PROCEDURE AddNewCustomer 
@CustomerID nchar (5), 
@CompanyName nvarchar(40), 
@ContactName nvarchar(30) = NULL, 
@ContactTitle nvarchar(30) = NULL, 
@Address nvarchar(60) = NULL, 
@City nvarchar(15) = NULL, 
@Region nvarchar(15) = NULL, 
@PostalCode nvarchar(10) = NULL, 
@Country nvarchar(15) = NULL, 
@Phone nvarchar(24) = NULL, 
@Fax nvarchar(24) = NULL 
RS 
INSERT INTO Customers 
(CustomerID, CompanyName, ContactName, ContactTitle, Address, City, Region, PostalCode, 
Country, Phone, Fax) 
VALUES 
(@CustomerID, @ CompanyName, (@ ContactName, @ ContactTitle, @Address, @City, @ Region, 
@PostalCode, (@Country, @Phone, @Fax) 
GO 


在 执行 如 本 例 所 示 的 包含 多 个 输入 参数 的 存储 过 程 时 ,可 以 有 两 种 参数 传递 的 方式 : 
位 置 传送 和 按 参数 名 传送 。 按 位 置 传送 的 方法 在 执行 存储 过 程 时 ,直接 给 出 参数 的 值 , 值 
顺序 和 创建 存储 过 程 的 语句 中 参数 定义 的 顺序 一 致 ,如 下 所 示 : 

EXEC AddNewCustomer 

'GROST', 'GROSTLLA — Restaurant', 'Manuel Pereira', 'Owner'， 


'Los Palos Grandes', 'Caracas', 'DF', '10784', 'Venezuela’, 
'283 ~ 2951’, '283.— 3397" 


通过 参数 名 传递 的 方法 是 在 执行 存储 过 程 时 给 出 参数 的 名 称 和 参数 值 , 如 下 所 示 : 
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EXEC AddNewCustomer 
@CustomerID = 'GROST'， 
@CompanyName = 'GROSTLLA — Restaurant', 
@ContactName = 'Manuel Pereira’, 
@ContactTitle = 'Owner’, 
@Address = 'Los Palos Grandes', 
@City= 'Caracas', 

@Region = 'DF', 

@PostalCode = '10784"', 
@Country = 'Venezuela', 

@Phone = '283 — 2951', 

@Fax = '283 — 3397"' 


在 这 种 方法 中 ,多 个 参数 可 以 按照 任意 的 顺序 给 出 ,而 无 须 与 创建 过 程 语句 中 的 顺序 一 


致 ,但 如 果 有 一 个 参数 以 这 种 方式 给 出 ,其 他 所 有 参数 都 必须 按 这 种 格式 出 现 。 


出 


例 8. 10 存储 过 程 中 除了 CustomerID 和 CompanyName 这 两 个 参数 外 的 其 他 参数 都 给 
了 默认 值 。 如 果 指定 了 默认 值 , 则 在 执行 存储 过 程 时 可 以 不 给 出 这 些 参数 的 值 , 需 要 注意 


的 是 ,默认 值 必须 是 常量 或 NULL。 


【 例 8. 11】 创建 带 有 输出 参数 的 存储 过 程 ,返回 某 个 供应 商 所 供应 的 所 有 商品 的 品种 


数量 。 


输 


用 


CREATE PROCEDURE SupplierProduct 
@CompanyName nvarchar(40), (WProductCount int OUTPUT 
RS 
SELECT @ProductCount = COUNT( * ) 
FROM Products P，Suppliers S 
WHERE 
S. SupplierID = P. SupplierID AND S. CompanyName = (@CompanyName 
G0 


关键 字 OUTPUT 表明 这 是 一 个 输出 参数 ,需要 注意 ,如 果 在 一 个 存储 过 程 定义 中 既 有 
入 参数 又 有 输出 参数 ,那么 输出 参数 应 该 位 于 所 有 输入 参数 之 后 。 为 了 接收 上 述 存储 过 


程 的 返回 值 ,在 调用 该 过 程 的 程序 中 必须 声明 用 来 接收 输出 参数 的 局 部 变量 。 此 外 ,不 能 使 


OUTPUT 将 常量 传递 给 存储 过 程 。 


DECLARE @ pCount int 

EXEC SupplierProduct 

'Karkki Oy', (@pCount output 
SELECT (@pCount 

GO 


或 者 : 


DECLARE (@pCount int 

EXEC SupplierProduct 
@CompanyName = 'Karkki Oy', 
@ProductCount = (@pCount output 
SELECT (@pCount 

GO 
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每 个 存储 过 程 执行 后 都 会 返回 一 个 状态 值 .调用 程序 可 以 根据 这 个 状态 值 进 行 相应 的 
处 理 。 一 般 用 0 表示 存储 过 程 执行 成 功 ,用 户 也 可 以 在 存储 过 程 中 用 RETURN 语句 返回 
自己 指定 的 值 。 用 输出 参数 也 一 样 ,如 果 用 户 要 得 到 存储 过 程 返回 的 状态 值 ,需要 事先 声明 
一 个 接收 变量 ,可 以 对 例 8. 10 的 执行 部 分 做 简单 修改 : 


DECLARE (@ status int 

EXEC (@ status = AddNewCustomer 
@CustomerID= 'GROST', 
@CompanyName = 'GROSTLLA — Restaurant', 
@ContactName = 'Manuel Pereira', 
@ContactTitle = 'Owner', 
@Address = 'Los Palos Grandes'， 


@City= 'Caracas', 

@Region= 'DF', 

@PostalCode = '10784"', 

@Country = 'Venezuela', 

@Phone = '283 — 2951', 

@Fax = '283 - 3397' 
IF @status= 0 

PRINT 'INSERT Operation Success!' 
ELSE 

PRINT 'INSERT Operation Failed!' 
G0 

上 例 中 ,用 变量 @status 接收 存储 过 程 AddNewCustomer 执行 的 返回 值 ,并 根据 返回 
值 显示 相应 的 提示 信息 。 


8.2.3 管理 存储 过 程 

1. 重新 命名 存储 过 程 

可 以 使 用 sp_rename 对 现 有 存储 过 程 重新 命名 ,其 格式 为 
sp_rename 原 过 程 名 新 过 程 名 


例如 ,要 把 例 8. 11 中 创建 的 存储 过 程 SupplierProduct 更 名 为 ProductOfSupplier, 可 以 
执行 如 下 命令 : 

sp_rename SupplierProduct ProductOfSupplier 

之 后 便 可 以 使 用 新 名 称 执行 该 存储 过 程 了 。 在 对 象 资源 管理 器 中 对 存储 过 程 进行 重合 
名 操作 与 在 Windows 资源 管理 器 中 对 文件 重 命名 一 样 ,选择 某 个 存储 过 程 并 右 击 ,在 弹出 
的 菜单 中 选择 “ 重 命名 ” 即 可 。 


2. 修改 存储 过 程 


已 经 创建 的 存储 过 程 中 可 能 会 存在 一 些 馆 辑 上 的 错误 ,或 者 在 使 用 过 程 中 有 了 新 的 功能 
需求 ,这 时 可 能 需要 对 存储 过 程 进行 修改 ,修改 存储 过 程 可 以 通过 ALTER PROCEDURE 语句 
来 实现 ,其 语法 如 下 : 


数据 库 原理 


ALTER PROC [ EDURE ] procedure name [ ; number ] 
[ { @parameter data _ type } 
[ VARYING ] [ = default ] [ OUTPUT ] 
][,...n] 
[ WITH 
{ RECOMPILE | ENCRYPTION | RECOMPILE , ENCRYPTION } ] 
[ FOR REPLICATION ] 
AS sql_statements 


其 中 各 个 参数 和 关键 字 的 具体 含义 请 参见 8. 2. 2 节 中 有 关 CREATE PROCEDURE 


语句 的 说 明 。 


例 8. 12 修改 例 8. 11 中 的 存储 过 程 ,实现 返回 某 个 供应 商 所 供应 的 某 类 商品 的 品种 数 


量 , 同 时 要 求 对 过 程 进 行 加 密 。 
【 例 8. 12】 


ALTER PROCEDURE SupplierProduct 
@CompanyName nvarchar(40), 
@CategoryName nvarchar(15), 
@ProductCount int OUTPUT 
WITH ENCRYPTION 
AS 
SELECT @ProductCount = COUNT( * ) 
FROM Suppliers INNER JOIN 
Products ON Suppliers. SupplierID = Products. SupplierID INNER JOIN 
Categories ON Products. CategoryID = Categories.CategoryID 
AND Suppliers. CompanyName = (QCompanyName 
AND Categories. CategoryName = (@CategoryName 
GO 


从 例 8. 12 中 可 以 看 出 ,在 修改 存储 过 程 的 时 候 , 既 可 以 增加 或 删除 一 
ENCRYPTION 这 样 的 选项 ,也 可 以 修改 过 程 中 TransactrSQL 语句 的 内 容 。 


管理 器 中 同样 可 以 对 存储 过 程 的 内 容 进行 修改 。 
3. 删除 存储 过 程 
使 用 DROP PROCEDURE 可 以 删除 一 个 或 多 个 存储 过 程 , 其 语法 为 : 
DROP PROCEDURE { procedure } [ ,...n] 
例如 ,要 删除 例 8. 11 中 创建 的 存储 过 程 ,可 以 执行 以 下 命令 : 


DROP PROCEDURE SupplierProduct 


8.2.4 系统 存储 过 程 


些 如 WITH 
另外 ,在 企业 


系统 存储 过 程 由 SQL Server 自动 创建 并 存储 在 master 数据 库 中 ,其 名 称 都 以 sp_ 为 前 
级 。 管 理 员 可 以 通过 SQL Server 提供 的 系统 存储 过 程 进行 管理 性 和 信息 性 的 工作 ,可 以 从 
其 他 数据 库 中 执行 系统 存储 过 程 ,而 无 须 使 用 master 数据 库 名 来 完全 限定 该 存储 过 程 的 名 
称 。SQL Server 所 提供 的 系统 存储 过 程 数量 众多 ,可 以 对 系统 存储 过 程 按 类 别 进行 分 组 。 
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一 些 常用 的 系统 存储 过 程 分 类 包括 : 

。 数据 库 维 护 计 划 过 程 : 用 于 设置 确保 数据 库 性 能 所 需 的 核心 维护 任务 。 
分 布 式 查询 过 程 : 用 于 执行 和 管理 分 布 式 查 询 。 

。 全 文 检索 过 程 : 用 于 执行 和 查询 全 文 索引 。 

。 日 志 传 送 过 程 : 用 于 配置 和 管理 日 志 传 送 。 

。 游标 过 程 : 执行 游标 变量 功能 。 

。 安全 过 程 : 用 于 管理 安全 性 。 

。 复制 过 程 : 用 于 管理 复制 。 

。 SQL 事件 探查 器 过 程 : 由 SQL 事件 探查 器 用 于 监视 性 能 和 活动 。 

。 系统 过 程 : 用 于 SQL Server 的 常规 维护 。 

前 文 曾 提 到 过 的 用 于 查看 存储 过 程 代 码 和 相关 信息 的 sp_help 过 程 和 sp_helptext 过 
程 就 是 属于 “系统 过 程 类 ”的 存储 过 程 。 具 体 每 一 类 别 中 所 包括 的 系统 过 程 以 及 它们 的 功能 
和 使 用 方法 ,读者 可 参阅 SQL Server 联机 从 书 中 的 相关 内 容 , 此 处 不 再 著述 。 

在 创建 自 定义 存储 过 程 时 ,尽量 要 避免 使 用 带 有 sp_ 前 缀 的 过 程 名 称 ,因为 SQL Server 
遇 到 以 sp_ 开 头 的 存储 过 程 首先 会 在 master 数据 库 中 进行 查找 操作 ,之 后 再 根据 所 提供 的 
数据 库 名 或 所 有 者 限定 符 查找 存储 过 程 ,如 果 没 有 指定 所 有 者 , 则 以 dbo 为 所 有 者 进行 查 
找 。 换 句 话说 ,如 果 当 前 数据 库 中 存在 带 有 sp_ 前 缀 的 用 户 自 定义 存储 过 程 ,即使 使 用 数据 
库 名 对 存储 过 程 进 行 了 限定 ,系统 仍然 会 先 检 查 master 表 , 这 在 一 定 程度 上 会 影响 过 程 的 
执行 效率 。 此 外 ,还 有 更 重要 的 一 点 ,如果 用 户 自 定义 的 存储 过 程 使 用 了 和 某 个 系统 存储 过 
程 相同 的 名 称 , 则 用 户 过 程 将 永远 不 会 执行 ,因此 在 实际 应 用 中 一 定 要 特别 注意 这 些 问 题 。 


6.3 本 章 小 结 


嵌入 式 SQL 的 实现 扩充 宿主 语言 的 编译 程序 ,使 之 能 执行 SQL 语句 。SQL 和 宿主 语 
言 的 接口 是 数据 库 和 宿主 语言 程序 间 信 息 的 传递 是 通过 共享 变量 实现 的 。 典 入 式 SQL 编 
程 分 为 静态 SQL 和 动态 SQL 编程 。 静 态 SQL 在 编译 时 已 经 确定 了 引用 的 表 和 列 。 主 变 
量 不 改变 表 和 列 信息 。 动 态 SQL 不 是 在 编译 时 确定 SQL 的 表 和 列 ,而 是 让 程序 在 运行 时 
提供 ,并 将 SQL 语句 文本 传 给 DBMS 执行 。 按 照 功 能 和 处 理 上 的 划分 ,动态 SQL 一 般 分 
成 动态 修改 和 动态 查询 , 即 动态 游标 。 

在 各 种 DBMS 系统 中 ,存储 过 程 是 非常 重要 的 工具 ,是 一 组 TransactrSQL 语句 集合 。 
使 用 存储 过 程 可 以 高 效 地 完成 对 数据 库 的 各 种 操作 ,而 且 可 以 多 次 使 用 ,提高 了 程序 的 可 重 
性 。 熟 练 掌握 存储 过 程 并 在 数据 库 应 用 程序 的 开发 中 加 以 适当 运用 是 非常 有 必要 的 。 


数据 库 车 产品 简介 | 简介 


自 关 系 型 数据 库 诞生 以 来 ,数据 库 产品 层出不穷 。 本 章 将 介绍 主流 数据 库 产品 中 SQL 
Server ,Oracle.MySQL Sybase 和 DB2 的 主要 特点 ,并 据 此 来 选择 合适 的 数据 库 产品 。 


6 SOL Server 


SQL Server 是 基于 图 形 的 管理 界面 .集中 式 的 管理 ,支持 多 客户 应 用 程序 、 企 业 级 的 应 
用 程序 以 及 多 个 不 同 的 开发 平台 ,运行 于 Windows 操作 系统 上 。SQL Server 是 一 个 实际 
可 运行 的 存储 、 维 护 和 为 应 用 系统 提供 数据 的 软件 系统 ,是 存储 介质 .处 理 对 象 和 管理 系统 
的 集合 体 。 它 通常 由 软件 .数据库 和 数据 管理 员 组 成 。 其 软件 主要 包括 操作 系统 、 各 种 宿主 
语言 ,实用 程序 以 及 数据 库 管理 系统 。 数 据 库 是 依照 某 种 数据 模型 组 织 起 来 并 存放 在 二 级 
存储 器 中 的 数据 集合 。 这 些 数据 为 多 个 应 用 服务 ,独立 于 具体 的 应 用 程序 。 数 据 库 由 数据 
库 管理 系统 统一 管理 ,数据 的 插入 ,修改 和 检索 均 要 通过 数据 库 管 理 系统 进行 。 数 据 库 管理 
系统 是 一 种 系统 软件 , 它 的 主要 功能 是 维护 数据 库 并 有 效 地 访问 数据 库 中 任意 部 分 数据 ,以 
保证 在 数据 库 维护 过 程 中 数据 的 完整 性 .一 致 性 和 安全 性 。 


9.1.1 SOL Server 的 简介 


最 早 的 SQL Server 是 由 微软 公司 和 Sybase 公司 联合 开发 的 ,1994 年 4 月 以 后 双方 决 
定 各 自 独立 开发 自己 的 数据 库 系 统 。 在 短 短 几 年 时 间 里 SQL Server 得 到 了 快速 发 展 。 从 
早期 的 SQL Server 4. 2 到 现在 的 SQL Server 2008 ,其 间 经 过 了 几 次 大 的 升级 ,最 重要 的 一 
次 升级 就 是 从 SQL Server 6. 5 到 SQL Server 7. 0 的 变化 ,在 SQL Server 7.0 中 ,这 个 数据 
库 核 心 部 分 经 过 重新 设计 ,性 能 和 可 用 性 有 了 很 大 的 提高 ,具备 了 从 性 能 上 挑战 其 他 数据 库 
产品 的 能 力 。2000 年 ,微软 公司 推出 了 企业 级 的 数据 库 系统 SQL Server 2000。SQL 
Server 2000 很 大 一 部 分 结构 沿用 了 SQL Server 7.0 的 设计 ,在 此 基础 上 增加 了 许多 有 用 的 
功能 ,增强 了 可 靠 性 ,并 且 提 供 了 在 线 数据 分 析 等 商业 化 应 用 ,引入 了 数据 仓库 ,数据 挖掘 等 
新 特性 。SQL Server 2000 在 市 场 上 有 很 高 的 占有 率 ,在 当时 成 为 占 市 场 份额 第 一 的 数据 
库 管理 系统 产品 。SQL Server 在 整个 发 展 过 程 中 一 直 是 为 运行 Windows 操作 系统 的 PC 
服务 器 设计 和 优化 的 ,在 此 期 间 Windows 操作 系统 的 PC 服务 器 都 有 了 巨大 的 进步 ,这 也 
同时 推动 了 SQL Server 的 发 展 。 

2005 年 ,微软 公司 推出 了 经 过 重大 改进 的 SQL Server 2005。 该 版 本 开发 周期 长 ,在 很 
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多 地 方 对 系统 特性 进行 了 改进 。 新 引进 了 集成 服务 .报表 服务 等 功能 ,增强 了 对 . NET 
Framework 的 支持 ,使 基于 数据 库 的 应 用 开发 效率 和 特性 得 到 进一步 的 提升 , 黄 定 了 大 型 
企业 级 数据 管理 应 用 系统 的 基础 。 

2008 年 ,微软 公司 又 推出 了 SQL Server 2008。SQL Server 2008 是 一 个 重大 的 产品 版 
本 , 它 推出 了 许多 新 的 特性 和 关键 的 改进 ,使 得 它 成 为 至 今 为 止 的 最 强大 和 最 全 面 的 SQL 
Server 版 本 。 

SQL Server 2008 在 Microsoft 的 数据 平台 上 发 布 ,组 织 随时 随地 管理 任何 数据 。 它 可 
以 将 结构 化 、 半 结构 化 和 非 结 构 化 文档 的 数据 (例如 图 像 和 音乐 ) 直接 存储 到 数据 库 中 。 
SQL Server 2008 提供 一 系列 丰富 的 集成 服务 ,可 以 对 数据 进行 查询 .搜索 .同步 .报告 和 分 
析 之 类 的 操作 。 数 据 可 以 存储 在 各 种 设备 上 ,从 数据 中 心 最 大 的 服务 器 一 直到 桌面 计算 机 
和 移动 设备 ,都 可 以 控制 数据 ,而 不 用 管 数据 存储 在 哪里 。 

SQL Server 2008 允许 在 使 用 Microsoft .NET 和 Visual Studio 开发 的 自 定义 应 用 程 
序 中 使 用 数据 ,在 面向 服务 的 架构 (SOA) 和 通过 Microsoft BizTalk Server 进行 的 业务 流程 
中 使 用 数据 。 信 息 工 作 人 员 可 以 通过 他 们 日 常 使 用 的 工具 直接 访问 数据 。SQL Server 
2008 提供 了 一 个 可 信 的 、 高 效率 智能 数据 平台 ,可 以 满足 用 户 的 所 有 数据 需求 。 


9.1.2 SOL Server 的 特点 


1. 客户 机 /服务 器 体系 


客户 机 /服务 器 体系 属于 一 种 分 布 式 计算 技术 , 它 的 特点 是 程序 中 的 所 有 数据 处 理 过 
程 , 不 像 若干 桌面 系统 的 大 型 机 那样 发 生 在 一 台 单独 的 计算 机 上 。 相 反 ,SQL Server 的 不 
同 部 分 同时 工作 在 不 同 的 计算 机 上 ,彼此 之 间 通 过 网 络 交换 信息 协调 工作 。SQL Server 运 
行 在 服务 器 上 负责 主要 的 数据 处 理工 作 。 在 客户 端的 计算 机 上 客户 端 程序 通过 网 络 向 服务 
器 提交 查询 ,并 接收 查询 结果 。 


2. 关系 型 数据 库 


组 织 数据 库 中 的 数据 有 很 多 种 方法 ,而 关系 数据 库 是 其 中 最 为 高 效 的 一 种 。 关 系 型 数 
据 库 具有 以 下 特点 : 关系 模型 的 概念 单一 ,实体 和 实体 之 间 的 联系 用 关系 来 表示 ; 回 以 
关系 数学 为 基础 ; @ 数 据 的 物理 存储 和 存 取 路 径 对 用 户 不 透明 ; @ 关 系数 据 库 语 言 是 非 过 
程 化 的 。 

在 关系 型 数据 库 中 ,数据 被 收集 在 表 中 , 表 包 含 了 描述 对 数据 库 项 目 具 有 重要 意义 的 对 
象 的 相关 信息 。 每 个 表 都 由 列 和 行 组 成 。 每 一 列 的 描述 都 代表 对 象 的 某 个 属性 。 每 一 行 都 
表示 表 所 属 的 对 象 的 一 个 实例 。 

表 和 表 之 间 存 在 着 一 些 特定 的 关系 ,这 些 关系 是 由 数据 库 设 计 者 按照 现实 中 的 事物 间 
的 联系 经 过 提取 、 抽 象 出 来 的 ,因此 ,关系 型 数据 库 在 组 织 数据 方面 最 接近 人 类 的 思维 模式 。 


3. T-SQL 语言 


处 理 关系 型 数据 库 最 常用 的 是 SQL 语言 ,SQL 是 结构 化 查询 语言 (Structured Query 
Language) 的 缩写 ,被 美国 国家 标准 化 组 织 (ANSI) 和 国防 标准 化 组 织 (ISO) 采 纳 为 关系 型 


数据 库 原理 


数据 库 的 标准 开发 语言 ,并 制定 了 统一 的 标准 SQL Server 使 用 的 SQL 语言 。 微 软 公司 在 
标准 的 SQL 语言 基础 上 加 以 扩充 , 称 为 TransactSQL(T-SQL) ,意思 是 面向 事务 处 理 的 
SQL 语言 。T-SQL 是 Microsoft SQL Server 应 用 程序 使 用 的 主要 语言 。 


4. 支持 数据 复制 


SQL Server 提供 了 完备 的 复制 功能 。 通 过 使 用 复制 功能 ,用 户 可 以 产生 数据 的 复制 
件 ,移动 这 些 数据 的 复制 件 到 任何 其 他 的 地 方 ,并 自动 化 地 同步 数据 ,以 便 分 布 式 环境 下 的 
多 个 数据 复制 件 保持 相同 的 数据 值 。SQL Server 的 复制 功能 具有 相当 的 灵活 性 ,这 使 得 在 
同一 台 服 务 器 的 数据 库 间或 依赖 网 络 互 连 的 多 台 服 务 器 间 可 以 方便 地 实现 复制 。 

复制 工具 Replication Wizards 极 大 地 简化 了 开发 .实现 和 维护 复制 的 步骤 。 其 中 ， 
Configure Publishing and Distribution Wizard 被 用 于 帮助 用 户 将 一 台 服 务 器 标识 为 分 发 
者 ,并 可 以 选择 标识 其 他 的 复制 部 件 ; Create Publication Wizard 可 协助 用 户 创建 出 版 物 ; 
Push Subscription Wizard 可 协助 用 户 从 一 台 服 务 器 上 将 出 版 物 “ 推 "到 一 个 或 多 个 服务 器 
甚至 服务 器 组 上 ; Pull Subscription Wizard 可 协助 用 户 从 一 台 服 务 器 上 的 出 版 物 “ 拉 ”到 其 
他 服务 器 的 数据 库 中 ; Disable Publishing and Distribution Wizard 可 协助 用 户 在 一 台 服 务 
器 上 禁止 出 版 ,分 发 ; Replication Conflict Viewer 可 协助 用 户 查看 和 解决 合并 复制 过 程 中 
发 生 的 冲突 。 

5. 支持 分 布 式 事务 处 理 


SQL Server 使 用 分 布 式 事务 处 理 协调 程序 (Distributed Transaction Coordinator， 
DTC) 进 行 分 布 式 事务 处 理 ( 跨 两 种 平台 )。 


6. 支持 数据 仓库 


SQL Server 支持 一 些 海量 数据 库 的 操作 ,这 些 数 据 库 包含 了 来 自 于 面向 事务 的 数据 库 
的 数据 。 这 些 大 型 数据 库 用 来 研究 趋势 ,这 些 趋 势 决 非 一 般 草率 的 检查 可 以 发 现 的 。 而 
SQL Server 所 支持 的 数据 仓库 又 是 一 个 面向 主题 的 、 集 成 的 .相对 稳定 的 反映 历史 变化 的 
数据 集合 ,用 于 支持 管理 决策 。 在 支持 决策 方面 ,数据 仓库 采用 面向 分 析 型 数据 处 理 的 方 
法 ,该 方法 使 它 不 同 于 企业 现 有 的 操作 型 数据 库 ; 集成 性 方面 ,数据 仓库 是 对 多 个 异 构 的 数 
据 源 的 有 效 集成 ,集成 后 按照 主题 进行 了 重组 ,并 包含 了 历史 数据 ,而 且 这 些 存 放 在 数据 仓 
库 中 的 历史 数据 往往 不 再 修改 。 


7. 内 建 式 的 在 线 分 析 处 理 


SQL Server 的 众多 优点 之 一 是 将 在 线 分 析 处 理工 具 服务 内 建 于 数据 库 管理 服务 中 。 
这 部 分 服务 称 为 微软 决策 支持 服务 (Microsoft Decision Support Services) 。 与 市 场 上 其 他 
数据 库 产品 所 提供 的 服务 不 同 ,不 用 再 购买 一 个 通常 很 昂贵 的 第 三 方 应 用 程序 。 这 就 大 大 
降低 了 花 在 数据 库 使 用 者 特别 是 数据 库 系统 开发 上 的 总 费用 。 


9.1.3 SQL Server 2008 的 新 特性 


SQL Server 2008 出 现在 微软 数据 平台 愿景 上 是 因为 它 使 得 公司 可 以 运行 他 们 最 关键 
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任务 的 应 用 程序 ,同时 降低 了 管理 数据 基础 设施 和 发 送 观 察 信 息 给 所 有 用 户 的 成 本 。SQL 
Server 2008 在 SQL Server 2005 的 基础 上 增加 了 对 空间 和 非 结 构 型 数据 的 支持 ,并 且 增 强 
了 管理 功能 。 

SQL Server 2008 具有 以 下 特点 : 

。 可 信任 性 一 一 使 得 公司 可 以 以 很 高 的 安全 性 .可 靠 性 和 可 扩展 性 来 运行 他 们 最 关键 

任务 的 应 用 程序 。 
。 高 效 性 一 一 使 得 公司 可 以 降低 开发 和 管理 他 们 的 数据 基础 设施 的 时 间 和 成 本 。 
。 智能 性 一 一 提供 一 个 全 面 的 平台 ,可 以 在 用 户 需 要 的 时 候 给 他 发 送信 息 。 


1. 可 信任 性 


在 今天 数据 驱动 的 世界 中 ,公司 需要 继续 访问 他 们 的 数据 。SQL Server 2008 为 关键 
任务 应 用 程序 提供 了 强大 的 安全 特性 可 靠 性 和 可 扩展 性 。 

(1) 信息 保护 

在 过 去 的 SQL Server 2005 的 基础 之 上 ,SQL Server 2008 做 了 以 下 方面 的 增强 来 扩展 
它 的 安全 性 : 简单 的 数据 加 密 、 外 键 管理 和 审计 。 

@ 简单 的 数据 加 密 

SQL Server 2008 可 以 对 整个 数据 库 、 数 据 文件 和 日 志文 件 进行 加 密 , 而 不 需要 改动 应 
用 程序 。 在 SQL Server 2008 里 ,有 几 个 加 密 选择 。 其 一 是 透明 数据 加 密 , 整 个 数据 库 可 以 
通过 SQL 引擎 加 密 。 该 方式 加 密 了 所 有 数据 库 的 数据 和 日 志文 件 。 进 行 加 密使 公司 可 以 
满足 遵守 规范 及 其 关注 数据 隐私 的 要 求 。 第 二 个 加 密 方式 是 备份 加 密 。SQL Server 2008 
备份 加 密 的 方式 可 以 防止 数据 泄露 和 被 算 改 。 简 单 的 数据 加 密 的 好 处 包括 使 用 任何 范围 或 
模糊 查询 搜索 加 密 的 数据 、 加 强 数 据 安全 性 以 防止 未 授权 的 用 户 访 问 。 

@ 外 键 管理 

SQL Server 2008 为 加 密 和 密 钥 管理 提供 了 一 个 全 面 的 解决 方案 。 为 了 满足 不 断 发 展 
的 对 数据 中 心 信息 安全 性 更 强 的 需求 ,公司 投资 给 供应 商 来 管理 公司 内 的 安全 密 钥 。 如 果 
要 处 理 信 用 卡 或 遵循 PCI 的 处 理 ,SQL Server 2008 将 支持 硬件 安全 模块 (HSM)。HSM 是 
在 独立 于 要 保护 的 数据 的 本 地 用 来 存储 密 钥 的 第 三 方 硬件 解决 方案 。 

@ 审计 

SQL Server 2008 允许 监控 数据 的 更 改 或 访问 ,从 而 提高 了 遵从 性 和 安全 性 。SQL 
Server 2008 具有 像 服务 器 中 加 强 的 审查 的 配置 和 管理 这 样 的 功能 ,这 使 得 公司 可 以 满足 各 
种 规范 需求 。SQL Server 2008 还 可 以 定义 每 一 个 数据 库 的 审查 规范 ,所 以 审查 配置 可 以 
为 每 一 个 数据 库 做 单独 的 制定 。 

(2) 加 强 应 用 程序 稳定 性 

SQL Server 2008 继续 使 公司 具有 提供 简化 了 管理 并 具 高 可 靠 性 的 应 用 的 能 力 。 

@ SQL Server 2008 基于 SQL Server 2005 ,并 提供 了 更 可 靠 的 加 强 了 数据 库 镜像 的 平 
台 。 新 的 特性 包括 页 面 自动 修复 、 提 高 了 性 能 和 加 强 了 可 支持 性 。 

@ 热 添 加 CPU ,为 了 在 线 添加 内 存 资 源 而 扩展 SQL Server 中 的 已 有 的 支持 , 热 添加 
CPU 使 数据 库 可 以 按 需 扩展 。 事 实 上 ,CPU 资源 可 以 添加 到 SQL Server 2008 所 在 的 硬件 
平台 上 而 不 会 影响 相关 程序 的 正常 运行 。 
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(3) 系统 性 能 最 佳 化 与 预测 功能 

SQL Server 2008 提供 了 一 个 广泛 的 功能 集合 ,使 数据 平台 上 的 所 有 工作 负载 的 执行 
都 是 可 扩展 的 和 可 预测 的 。SQL Server 2008 推出 了 范围 更 大 的 数据 采集 ,一 个 用 于 存储 
性 能 数据 的 新 的 集中 的 数据 库 , 以 及 新 的 报表 和 监控 工具 。 在 备份 压缩 和 数据 压缩 等 方面 ， 
SQL Server 2008 也 有 显著 的 性 能 改进 。SQL Server 2008 通过 提供 了 一 个 新 的 制定 查询 
计划 的 功能 ,从 而 提供 了 更 好 的 查询 执行 稳定 性 和 可 预测 性 。 


2. 高 效 性 


SQL Server 2008 降低 了 管理 系统 、. NET 架构 和 Visual Studio Team System 的 时 间 
和 成 本 ,使 得 开发 人 员 可 以 开发 强大 的 下 一 代数 据 库 应 用 程序 。 

(1) 基于 政策 的 管理 

作为 微软 正在 努力 降低 公司 的 总 成 本 所 做 的 工作 的 一 部 分 ,SQL Server 2008 推出 了 
陈述 式 管理 架构 (DMF ) , 它 是 一 个 用 于 SQL Server 数据 库 引 擎 的 新 的 基于 策略 的 管理 框 
架 。 这 种 陈述 式 管理 为 用 户 提供 了 以 下 优点 : 遵从 系统 配置 的 政策 ; 监控 和 防止 通过 创建 
不 符合 配置 的 政策 来 改变 系统 的 操作 ; 简化 管理 工作 以 便 达到 减少 公司 总 成 本 的 目的 ; 使 
用 SQL Server 管理 套件 查找 遵从 性 问题 。 

陈述 式 管理 架构 是 一 个 基于 政策 的 系统 ,用 于 管理 一 个 或 多 个 SQL Server 2008 实例 。 
DMF 由 三 个 组 件 组 成 : 政策 管理 .创建 政策 的 政策 管理 员 和 显 式 管理 。 政 策 管理 员 选 择 一 
个 或 多 个 要 管理 的 对 象 , 并 显 式 检查 这 些 对 象 是 否 遵守 指定 的 政策 ,或 显 式 地 使 这 些 对 象 遵 

(2) 安装 配置 的 改进 

SQL Server 2008 对 SQL Server 的 服务 生命 周期 提供 了 显著 的 改进 , 它 重新 设计 了 安 
装 .建立 和 配置 架构 。 这 些 改进 将 计算 机 上 的 各 个 安装 与 SQL Server 软件 的 配置 分 离开 
来 ,这 使 得 公司 和 软件 合作 伙伴 可 以 提供 推荐 的 安装 配置 。 

(3) 加 速 开发 过 程 

SQL Server 提供 了 集成 的 开发 环境 和 更 高 级 的 数据 提取 ,使 开发 人 员 可 以 创建 下 一 代 
数据 应 用 程序 ,同时 简化 了 对 数据 的 访问 。 改 进 主要 包括 ADO. NET 实体 框架 .语言 集成 
查询 能 力 `.CLR 集成 和 ADO. NET 对 象 服务 、Service Broker 可 扩展 性 和 Transact-SQL 的 
改进 。 

(4) 创建 偶尔 连接 系统 

SQL Server 2008 推出 了 一 个 统一 的 同步 平台 ,可 以 在 应 用 程序 .数据 存储 和 数据 类 型 
之 间 达 到 一 致 性 同步 。 在 与 Visual Studio 合作 的 基础 上 ,SQL Server 2008 可 以 通过 
ADO.NET 中 提供 的 新 的 同步 服务 和 Visual Studio 中 的 脱 机 设计 器 快速 地 创建 偶尔 连接 
系统 。 偶 尔 连 接 成 为 一 种 新 的 工作 方式 。SQL Server 2008 提供 了 支持 ,使 得 可 以 改变 跟 
踪 和 使 客户 以 最 小 的 执行 消耗 进行 功能 强大 的 执行 ,以 此 来 开发 基于 缓存 的 .基于 同步 的 和 
基于 通知 的 应 用 程序 。 

(5) 新 增 数据 类 型 

应 用 程序 正在 结合 使 用 越 来 越 多 的 数据 类 型 ,而 不 仅仅 是 过 去 数据 库 所 支持 的 那些 。 
SQL Server 2008 基于 过 去 对 关系 数据 的 强大 支持 ,提供 了 新 的 数据 类 型 使 得 开发 人 员 和 
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管理 员 可 以 有 效 地 存储 和 管理 非 结构 化 数据 ,例如 文件 文档 和 图 片 。 还 增加 了 对 管理 高 级 
地 理 数据 的 支持 。 除 了 新 的 数据 类 型 ,SQL Server 2008 还 提供 了 一 系列 对 不 同 数 据 类 型 
的 服务 ,提供 一 个 丰富 的 服务 集合 来 进行 数据 交互 作用 ,同时 为 数据 平台 提供 了 可 靠 性 、 安 
全 性 和 易 管 理性 。 


3. 智能 性 


商业 智能 继续 作为 大 多 数 公司 投资 的 关键 领域 和 对 于 公司 所 有 层面 的 用 户 来 说 的 一 个 
无 价 的 信息 源 。SQL Server 2008 提供 了 一 个 全 面 的 平台 ,可 以 为 用 户 提供 用 户 所 需要 的 
智能 化 服务 。 

(1) 集成 大 量 数据 

公司 继续 投资 于 商业 智能 和 数据 仓库 解决 方案 ,以 便 从 他 们 的 数据 中 获取 商业 价值 。 
SQL Server 2008 提供 了 一 个 全 面 的 和 可 扩展 的 数据 仓库 平台 , 它 可 以 用 一 个 单独 的 分 析 
存储 进行 强大 的 分 析 , 以 满足 成 千 上 万 的 用 户 在 几 兆 字 节 的 数据 中 的 需求 。 

(2) 发 送 相应 的 报表 

SQL Server 2008 提供 了 一 个 可 扩展 的 商业 智能 基础 设施 ,使 得 IT 人 员 可 以 在 整个 公 
司 内 使 用 商业 智能 来 管理 报表 以 及 任何 规模 和 复杂 度 的 分 析 。SQL Server 2008 报表 服务 
提供 另 一 个 完全 基于 服务 器 的 平台 , 它 被 设计 用 于 支持 广泛 的 报表 需求 ,使 得 公司 可 以 有 效 
地 以 用 户 想 要 的 格式 和 他 们 的 地 址 发 送 相应 的 .个 人 的 报表 给 成 千 上 万 的 用 户 。SQL 
Server 2008 报表 服务 提供 了 制作 从 很 多 数据 源 获得 数据 并 具有 丰富 的 格式 的 报表 所 需 
的 工具 和 功能 ,并 提供 了 一 组 全 面 的 工具 用 来 管理 和 保护 企业 报表 解决 方案 。 这 使 得 用 户 
可 以 在 他 们 各 自 的 领域 对 相关 信息 进行 及 时 访问 ,使 得 他 们 可 以 做 出 更 好 ,更 快 ,更 符合 实 
际 的 决策 。 

(3) 使 用 户 获得 全 面 的 洞察 力 

在 线 分 析 处 理 的 前 提 条 件 是 能 及 时 访问 到 准确 的 信息 ,使 用 户 在 应 对 问题 ,甚至 非常 复 
杂 的 问题 时 能 做 出 快速 反应 。SQL Server 2008 在 SQL Server 2005 强大 的 OLAP 能 力 的 
基础 上 做 了 进一步 改进 ,为 所 有 用 户 提供 了 更 快捷 的 查询 速度 。 这 个 性 能 的 提升 使 得 公司 
可 以 执行 具有 许多 维度 和 聚合 的 非常 复杂 的 分 析 。 这 个 执行 速度 与 Microsoft Office 的 深 
度 集成 相 结 合 ,使 SQL Server 2008 可 以 让 所 有 用 户 获 得 全 面 的 洞察 力 。 


9.1.4 应 用 程序 访问 SOL Server 的 实例 


以 下 是 C# 访问 示例 数据 库 的 表 Reader 的 一 个 小 例子 。 


// 连 接 数据 库 

String Cnstr= (@"server=.;Initial Catalog = DATA; Integrated Security= True" ; 
SqlConnenction con = new SqlConnenction(Cnstr); 

// 使 用 DataSet 读 取 数据 

String strSQL = "SELECT Rno, Rname, Rank, Sex, Age FROM Reader"; 

SqlDataAdapter da = new SqlDataAdapter (strSQL, con); 

DataSet ds = new DataSet( ); 

da.Fill(ds, "Reader"); 

// 显 示 数 据 


数据 库 原理 


String s= ""; 

Foreach(DataRow dr in ds. Tables[0]. Rows) 

{s=s+"Rno:"+ dr["Rno"].ToString() +" Rname:" + dr["Rname"].ToString() +" Rank:" + dr 
["Rank"]. ToString() +" Sex:"+ dr["Sex"].ToString()+" Age:"+ dr["Age"].T oString()+" "; 
} 

Labell. Text = s; 


6.2 Oracle 


Oracle 数据 库 系统 是 美国 Oracle 公司 (甲骨 文 ) 提 供 的 以 分 布 式 数据 库 为 核心 的 一 组 
软件 产品 ,是 目前 流行 的 客户 /服务 器 (CLIENT/SERVER) 或 B/S 体系 结构 的 数据 库 之 一 。 
它 支持 真正 的 对 象 的 概念 ,应 用 在 中 大 型 系统 中 ,主要 用 于 Linux、UNIX 系统 上 ,现在 也 有 
了 运行 于 Windows NT 系统 上 的 产品 。 


9.2.1 Oracle 的 发 展 历程 


1977 年 , Larry Ellison。 Bob Miner 和 Ed Oates 成 立 了 Relational Software 
Incorporated (RSIT 公司 ,他 们 使 用 C 和 SQL 接口 开发 了 关系 数据 库 关 系 系统 一 一 Oracle。 
不 久 , 他 们 推出 了 版 本 1 为 一 个 原型 。 在 1979 年 ,他 们 发 行 了 第 一 个 产品 。 

Oracle RDBMS 版 本 2 开始 是 工作 在 Digital PDP-11 机 器 (运行 RSX-11 操作 系统 ) 上 
的 ,后 来 工作 在 DESVAX 系统 上 。 

1983 年 推出 了 版 本 3, 它 几乎 全 部 由 C 语言 编写 而 成 ,RSI 也 改名 为 Oracle 公司 。 

1984 年 推出 了 版 本 4, 该 版 本 支持 VAX 系统 和 IBM VA 操作 系统 。 

1985 年 推出 了 版 本 5, 使 用 SQL x NET, 从 此 引入 了 客户 机 /服务 器 计算 ,因此 成 为 一 
个 新 的 里 程 碑 。 它 也 是 第 一 个 突破 640KB 限制 的 MS-DOS 产品 。 

1989 年 推出 了 版 本 6, 引 入 了 低层 锁 ,并 有 许多 性 能 改善 和 功能 增强 。 此 时 ,Oracle 可 
以 运行 在 许多 平台 和 操作 系统 上 。1991 年 ,在 DEC VAX 平台 上 的 Oracle RDBMS 版 本 6. 1 
中 引入 了 Oracle Parallel Server 选项 (OPS) ,不 久 并 行 服务 器 选项 可 运行 于 多 种 平台 。 

1992 年 Oracle 7 诞生 , 它 采 用 了 多 线索 服务 器 体系 结构 ,能 够 在 所 有 硬件 体系 结构 上 

为 大 量 用 户 提供 可 扩充 性 等 功能 。Oracle 7 在 内 存 CPU 和 工作 使 用 方面 进行 了 许多 结构 
性 修改 。 
1997 年 推出 了 Oracle 8, 它 增强 了 对 象 扩展 和 许多 新 特征 及 管理 工具 。Oracle 8 是 一 
个 紧密 集成 的 对 象 关系 数据 库 管 理 系 统 方案 , 它 没有 像 其 他 数据 库 产品 那样 只 是 在 关系 数 
据 库 和 用 户 端 应 用 软件 之 间 提 供 一 个 对 象 服务 器 网 关 , 或 者 在 现 有 的 数据 库 上 附加 一 个 采 
对 象 技术 的 外 壳 。 关 系 型 数据 库 和 对 象 技术 的 结合 ,使 用 户 不 需要 移植 现 有 Oracle 7 应 
软件 , 便 能 够 在 Oracle 8 上 使 用 , 极 大 保护 了 现 有 客户 的 投资 。 

1999 年 又 推出 了 Oracle 8i, 作 为 世界 上 第 一 个 全 面 支持 Internet 的 数据 库 ,Oracle 8i 
是 唯一 一 个 具有 集成 模式 Web 信息 管理 工具 的 数据 库 , 也 是 世界 上 第 一 个 具有 内 置 Java 
引擎 的 可 扩展 的 企业 级 数据 库 平台 。 它 具有 在 一 个 易于 管理 的 服务 器 中 同时 支持 数 个 用 户 
的 能 力 , 可 以 帮助 企业 充分 利用 Java 以 满足 其 迅速 增长 的 Internet 应 用 需求 。 通 过 支持 


第 9 章 数据库 产品 简介 


Web 高 级 应 用 所 需要 的 多 种 媒体 数据 来 支持 Web 繁忙 站 点 不 断 增长 的 负载 需求 ,Oracle 8i 
提供 了 在 Internet 上 运行 电子 商务 所 必需 的 可 靠 性 、 可 扩展 性 、 安 全 性 和 易 用 性 。 

2000 年 发 布 了 Oracle 9i, 继 承 和 改进 了 8i 的 特征 。 

2003 年 9 月 发 布 了 Oracle 10g。10g 支持 网 格 计算 , 即 多 台 结 点 服务 器 利用 高 速 网 络 
组 成 一 个 虚拟 的 高 性 能 服务 器 ,负载 在 整个 网 格 中 衡 , 按 需 增删 结 点 ,避免 了 单 点 故障 。 
Oracle 10g 支持 自动 管理 增删 硬盘 ,根据 需要 自动 分 配 和 释放 系统 内 存 , 可 以 快速 纠正 人 为 
错误 的 闪 回 查询 和 恢复 ,可 以 恢复 数据 库 、 表 甚至 记录 。 相 对 于 Oracle 9i 而 言 ,Oracle 10g 
存储 数据 的 表 空 间 可 以 器 平台 复制 , 极 大 地 提高 了 数据 仓库 加 载 速度 , 容 灾 的 数据 卫士 增加 
了 逮 辑 备份 功能 ,备份 数据 库 日 常 可 以 运行 于 只 读 状态 ,充分 利用 了 备份 数据 库 。 

2007 年 7 月 发 布 了 Oracle 11g。Oracle 从 出 现 伊始 发 展 到 现在 的 Oracle 11g ,成 为 第 
一 款 为 网 格 计算 而 设计 的 数据 库 。Oracle 11g 集成 了 Oracle 数据 库 管理 技术 的 所 有 优势 ， 
又 融入 了 网 格 计 算 的 各 种 新 的 性 能 特点 。 


9.2.2 Oracle 的 特点 


1. 支持 多 用 户 、 大 事务 量 的 高 性 能 的 事务 处 理 


引入 了 共享 SQL 和 多 线索 服务 器 体系 结构 。 这 些 技术 的 引入 增强 了 Oracle 的 能 力 ， 
并 大 大 减少 了 Oracle 的 资源 占用 ,使 之 在 低档 软 硬 件 平台 上 用 较 少 的 资源 就 可 以 支持 更 多 
的 用 户 ,而 在 高 档 平台 上 则 可 以 支持 成 百 上 千 个 用 户 。 


2. 数据 安全 性 和 完整 性 控制 

Oracle 数据 库 提供 了 基于 角色 分 工 的 安全 保密 管理 , 它 在 数据 库 管理 的 功能 、 安 全 性 、 
完整 性 的 检查 ,一致 性 方面 都 有 突出 的 表现 。 

3. 提供 对 数据 库 操作 的 接口 

Oracle 提供 对 数据 库 操作 的 接口 ,遵守 数据 存 取 语 言 .操作 系统 、 用 户 接 口 和 网 络 通信 
协议 的 工业 标准 。 

4. 支持 分 布 式 数据 库 和 分 布 处 理 

Oracle 数据 库 自 从 Oracle 5 起 就 提供 了 分 布 式 处 理 能 力 ,到 Oracle 7 就 有 比较 完善 的 


分 布 式 数据 库 功 能 了 ,可 以 让 客户 通过 网 络 比 较 方便 地 读 写 远 端 数 据 库 里 的 数据 ,并 提供 对 
称 复制 的 技术 。 


5. 具有 可 移植 性 .可 兼容 性 和 可 连接 性 


(1) 兼容 性 

Oracle 产品 采用 标准 SQL, 并 经 过 美国 国家 标准 技术 所 (NIST) 测 试 。 与 IBM SQL/ 
DS、DB2 IJNGRES IDMS/VR 等 兼容 。 

(2) 可 移植 性 

Oracle 的 产品 可 运行 于 很 宽 范围 的 硬件 与 操作 系统 平台 上 。 可 以 安装 在 70 种 以 上 不 
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同 的 大 .中 、 小 型 机 上 ,可 在 VMS、DOS、UNIX、Windows 等 多 种 操作 系统 下 工作 。 
(3) 可 连接 性 
能 与 多 种 通信 网络 相连 ,支持 各 种 协议 (如 TCP/IP .DECnet、LU6. 2 等 ) 。 


6. 完整 的 数据 管理 功能 


Oracle 数据 管理 功能 完备 ,具有 数据 的 大 量 性 、 数 据 保存 的 持久 性 、 数 据 的 共享 性 和 数 
据 的 可 靠 性 。 


7. 完备 关系 的 产品 


Oracle 是 完备 关系 的 产品 ,遵循 以 下 准则 : 

。 信息 准则 一 一 关系 型 DBMS 的 所 有 信息 都 应 在 逻辑 上 用 一 种 方法 , 即 表 中 的 值 显 
式 地 表示 ; 

。 保 证 访问 的 准则 ; 

。 视图 更 新 准则 : 只 要 形成 视图 的 表 中 的 数据 变化 了 ,相应 视图 中 的 数据 也 同时 发 生 
变化 ; 

。 数据 物理 性 和 逻辑 性 独立 准则 。 


8. 轻松 地 实现 数据 仓库 的 操作 


数据 仓库 需要 从 各 种 不 同 的 数据 源 取得 各 种 不 同 的 数据 ,并 且 把 这 些 巨 大 数据 量 的 数 
据 转 换 成 对 于 用 户 可 用 的 数据 ,为 企业 的 决策 提供 数据 支持 。 这 个 过 程 常常 被 称 为 ETL， 
即 提取 、 转 换 、 装 载 。Oracle 9i 引进 了 新 的 “ 边 装载 , 边 转 换 ” 的 办 法 来 取代 过 时 的 串 行 处 理 
步骤 : 先 转换 然后 装载 或 者 先 装载 然后 转换 。 在 Oracle 这 种 新 方法 里 ,数据 库 参 与 了 数据 
转换 和 装载 的 过 程 ,成 为 了 ETL 过 程 的 一 个 有 机 组 成 部 分 。 而 另外 有 些 原 来 必需 的 步骤 则 
没有 继续 存在 的 必要 了 , 另 一 些 则 可 以 得 到 改进 。Oracle 9i 也 因 这 种 功能 便利 的 数据 仓库 
的 操作 而 变 得 快速 高 效 。 


9. 支持 大 量 多 媒体 数据 
Oracle 支持 大 量 多 媒体 数据 ,如 二 进 制图 形 .声音 ,动画 以 及 多 维 数 据 结构 等 。 
9.2.3 Oracle 的 开发 工具 


Oracle 产品 主要 包括 数据 库 服 务 器 、 开 发 工具 和 连接 产品 三 类 ,并 且 提 供 了 多 种 开发 
工具 ,能 极 大 地 方便 用 户 进行 进一步 的 开发 。 

Oracle 提供 的 开发 工具 包 是 Developer、Designer、Discover、Oracle Office 等 , 它 涵盖 了 
从 建 模 、 分 析 、 设 计 到 具体 实现 的 各 个 环节 。 

(1) Developer 

它 包括 : Oracle Forms 用 于 快速 生成 基于 屏幕 的 复杂 应 用 ,具有 GUI 界面 和 多 媒体 功 
能 ,主要 用 于 操纵 数据 和 查询 ; Oracle Reports 是 快速 生成 报表 的 工具 ,能 生成 各 种 复杂 的 
报表 ,同样 能 处 理 多 媒体 信息 ; Oracle Graphics 用 于 生成 各 种 图 形 应 用 ; Oracle Books 用 于 
生成 联机 文档 。 
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(2) Designer 

这 是 Oracle 提供 的 CASE 工具 。 该 工具 能 够 帮助 用 户 对 复杂 系统 进行 建 模 、 分 析 和 设 
计 。 还 可 以 帮助 用 户 绘制 E-R 图 、 功 能 分 层 图 .数据 流 图 和 方 阵 图 。 

(3) Discover 

这 是 一 个 OLAP 工具 ,主要 用 于 支持 数据 仓库 应 用 。 它 可 以 对 历史 数据 进行 挖掘 ,以 
找到 发 展 趋势 ,对 不 同 层次 的 概况 数据 进行 分 析 , 以便 发 现 有 关 业 务 的 详细 信息 。 

(4) Oracle Office 

适用 于 办 公 自 动 化 ,能 完成 企业 范围 内 的 消息 接收 与 发 送 ,日 程 安排 .日 历 管理 .目录 管 
理 以 及 拼写 检查 。 


9.2.4 应 用 程序 访问 Oracle 的 实例 
以 下 是 Jsp 连接 Oracle 9i/108g 的 实例 : 


<% 

// 使 用 thin 模式 连接 数据 库 

String url = "jdbc:Oracle: thin: (@ localhost:1521 :test"; 

// localhost 为 数据 库 认 地 址 ,1521 为 连接 端口 号 ,test 为 数据 库 名 
String user = "scott"; 

String password = "pass"; 

Connection conn = DriverManager. getConnection(url, user, password); 
// 查 询 数据 

Statement stmt = conn. createStatement( 

ResultSet. TYPE_SCROLL SENSITIVE, ResultSet.CONCUR UPDATABLE); 
String sql = "SELECT Rno, Rname, Rank, Sex, Age FROM Reader" ; 
ResultSet rs = stmt. executeQuery( sql); 
while(rs.next()) {%> 
Rno 为 : <% = rs.getString(1)%> 
Rname 为 : <% = rs.getString(2) 多 > 
Rank 为: <% =rs.getString(3)%> 
Sex 为 : <% =rs.getString(4)%> 
Age 为 : <% = rs.getString(5) 当 > 
<%}%> 
< 名 out. print(" 数 据 库 操作 成 功 ."); %> 
// 关 闭 连接 
< 和 
rs.close( ); 
stmt. close(); 
conn. close( ); 

多 > 


@3 MySOL 


MySQL 是 一 个 真正 的 多 用 户 、 多 线程 SQL 数据 库 服 务 器 。MySQL 是 以 一 个 客户 机 / 
服务 器 结构 实现 的 ,是 由 一 个 服务 器 守护 程序 和 很 多 不 同 的 客户 程序 和 库 组 成 的 。 相 对 于 
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其 他 系统 而 言 ,MySQL 数据 库 可 以 称 得 上 是 目前 运行 速度 最 快 的 SQL 语言 数据 库 。 可 运 
行 在 大 多 数 的 Linux 平台 ,以 及 少许 非 Linux 甚至 非 UNIX 平台 上 。 通 俗 一 点 说 ,MySQL 
是 一 个 精巧 的 SQL 数据 库 管 理 系统 ,虽然 它 不 是 开放 源 代 码 的 产品 ,但 在 某 些 情 况 下 可 以 
自由 使 用 。 由 于 它 的 强大 功能 .灵活 性 .丰富 的 应 用 编程 接口 (API) 以 及 精巧 的 系统 结构 ， 
受到 了 广大 自由 软件 爱好 者 甚至 是 商业 软件 用 户 的 青睐 ,特别 是 与 Apache 和 PHP/PERL 
结合 ,为 建立 基于 数据 库 的 动态 网 站 提供 了 强大 的 动力 。 在 与 PHP 的 配合 使 用 中 被 Linux 
下 的 Web 开发 者 称 为 PHP 的 “黄金 搭档 ”。 


9.3.1 ”MySQL 简介 


MySQL 是 一 个 小 型 关系 型 数据 库 管理 系统 ,开发 者 为 瑞典 MySQL AB 公司 。 该 公司 
于 2008 年 1 月 16 日 被 Sun 公司 收购 。 而 2009 年 ,Sun 又 被 Oracle 收购 。 目 前 MySQL 被 
广泛 地 应 用 在 Internet 上 的 中 小 型 网 站 中 。 由 于 其 体积 小 、 速 度 快 .总 体 拥有 成 本 低 ,尤其 
是 具有 开放 源码 这 一 特点 ,许多 中 小 型 网 站 为 了 降低 网 站 总 体 拥有 成 本 而 选择 MySQL 作 
为 网 站 数据 库 。 

MySQL 包含 一 些 与 SQL 标准 不 同 的 转变 ,它们 大 多 数 被 设计 成 对 SQL 脚本 语言 不 足 
的 一 种 补偿 。 然 而 , 另 一 些 扩展 确实 使 MySQL 与 众 不 同 。 例 如 ,LINK 子 句 搜索 是 自动 忽 
略 大 小 写 的 。MySQL 也 允许 用 户 自 定义 的 SQL 函数 ,函数 必须 被 编译 到 一 个 共享 库 文件 
中 (. so 文件 ), 然 后 用 一 个 LOAD FUNCTION 命令 装载 。 它 也 缺乏 一 些 常 用 的 SQL 功 
能 ,没有 子 选择 (在 查询 中 的 查询 ), 视 图 也 没有 了 。 当 然 大 多 数 子 查 询 可 以 用 简单 的 连接 
(join) 子 句 重 写 , 但 有 时 用 两 个 嵌 套 的 查询 思考 问题 比 一 个 大 连接 容易 。 

MySQL 的 主要 的 缺陷 之 一 是 缺乏 标准 的 RI 机 制 ,解决 办 法 之 一 是 支持 唯一 索引 。 
Rule 限制 的 缺乏 (在 给 定 字段 域 上 的 一 种 固定 的 范围 限制 ) 通 过 大 量 的 数据 类 型 来 补偿 。 
不 简单 地 提供 检查 约束 、 外 部 关键 字 和 经 常 与 RI 相关 的 “级 联 删 除 ” 功 能 。MySQL 是 数据 
库 领域 的 中 间 派 。 它 缺乏 一 个 全 功能 数据 库 的 大 多 数 主要 特征 ,但 是 又 有 比 类 似 Xbase 记 
录 存 储 引擎 更 多 的 特征 。 它 像 企业 级 RDBMS 那样 需要 一 个 积极 的 服务 者 守护 程序 ,但 是 
不 能 像 他 们 那样 消费 资源 。 查 询 语言 允许 复杂 的 连接 查询 ,但 是 所 有 的 参考 完整 都 必须 由 
程序 员 强 制 保证 。 


9.3.2 ”MySQL 的 特点 
1. 多 线程 


多 线程 是 MySQL 的 关键 特性 ,MySQL 的 核心 程序 采用 完全 的 多 线程 编程 。 线 程 是 轻 
量 级 的 进程 , 它 可 以 灵活 地 为 用 户 提供 服务 ,而 不 过 多 地 占用 系统 资源 。 用 多 线程 和 C 语 
言 实现 的 MySQL 能 很 容易 地 充分 利用 CPU ,可 以 采用 多 CPU 体系 结构 。 


2. 开放 性 


MySQL 是 自由 的 开放 源 代码 产品 , 它 所 使 用 的 语言 SQL 以 ANSI SQL2 为 基础 ,这 个 
数据 库 引 擎 可 运行 在 多 个 平台 上 ,包括 Windows 2000、MacOSX、 Linux、 FreeBSO 和 
Solaris, 如 果 没 有 可 用 于 平台 的 二 进 制 文件 , 则 可 将 源 代码 在 相应 的 平台 上 进行 编译 。 
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3. 多 用 户 支 持 


同时 访问 数据 库 的 用 户 数 量 不 受 限 制 。MySQL 可 有 效 地 满足 50 一 1000 个 并 发 用 户 
的 访问 ,并 且 在 超过 600 个 用 户 限度 的 情况 下 ,MySQL 的 性 能 没有 明显 地 下 降 。 


4. 用 户 权 限 设置 简单 有效 

MySQL 有 一 个 非常 灵活 而 且 安全 的 权限 和 口令 系统 。 当 客户 与 MySQL 服务 器 连接 
时 ,二 者 之 间 所 有 的 口令 传送 被 加 密 , 而 且 MySQL 支持 主机 认证 。 

5. MySQL 可 运行 在 不 同 的 操作 系统 下 


简单 地 说 , MySQL 可 以 支持 Windows 95/98/NT/2000 及 以 上 版 本 ,以 及 UNIX、 
Linux 和 SUN OS 等 多 种 操作 系统 平台 。 这 意味 着 在 一 个 操作 系统 中 实现 的 应 用 可 以 很 方 
便 地 移植 到 其 他 的 操作 系统 下 。 


6. MySQOL 支持 ODBC for Windows 


MySQL 支持 所 有 的 ODBC 2. 5 函数 和 其 他 许多 函数 ,这 样 就 可 以 用 Access 连接 
MySQL 服务 器 ,从 而 使 得 MySQL 的 应 用 被 大 大 扩展 了 。 


7. MySQL 支持 大 型 的 数据 库 


虽然 对 于 用 PHP 编写 的 网 页 来 说 ,只 要 能 够 存放 上 百 条 以 上 的 记录 数据 就 足够 了 ,但 
MySQL 可 以 方便 地 支持 上 千 万 条 记录 的 数据 库 。 作 为 一 个 开放 源 代码 的 数据 库 , MySQL 
可 以 针对 不 同 的 应 用 进行 相应 的 修改 。 


8. 性 能 高 效 稳定 


MySQL 拥有 一 个 非常 快速 而 且 稳定 的 基于 线程 的 内 存 分 配 系统 ,可 以 持续 使 用 而 不 
必 担 心 其 稳定 性 。 事 实 上 ,MySQL 的 稳定 性 足以 应 付 一 个 超大 规模 的 数据 库 。 


9. 强大 的 查询 功能 


MySQL 支持 查询 的 SELECT 和 WHERE 语句 的 全 部 运算 符 和 函数 ,并 且 可 以 在 同一 
查询 中 混用 来 自 不 同 数据 库 的 表 , 从 而 使 得 查询 变 得 快捷 和 方便 。 


10. 应 用 程序 支持 


PHP 为 MySQL 提供 了 强力 支持 ,PHP 中 提供 了 一 整套 的 MySQL 函数 ,对 MySQL 
进行 了 全 方位 的 支持 。 


11. 为 多 种 编程 语言 提供 了 API 


MySQL 为 多 种 编程 语言 提供 了 API。 这 些 编程 语言 包括 C、C++、Python、Java、Perl、 
PHP 、Eiffel .Ruby 和 Tcl 等 。 
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9.3.3 MySQL 的 开发 工具 


使 用 各 种 精心 设计 的 工具 来 管理 MySQL 数据 库 要 比 单纯 使 用 传统 方法 轻松 得 多 。 开 
发 人 员 应 该 不 断 寻找 那些 能 够 缩短 开发 时 间 的 工具 。 


1. MySOL Workbench 


MySQL Workbench 是 一 个 由 MySQL 开发 的 跨 平台 、 可 视 化 数据 库 工 具 。 它 作为 
DBDesigner4 工程 的 替代 应 用 程序 而 备 受 瞩 目 。 


2. phpMyAdmin 


phpMyAdmin 是 一 款 免费 的 用 PHP 编写 的 工具 ,用 于 在 万 维 网 上 管理 MySQL, 它 支 
持 MySQL 的 大 部 分 功能 。phpMyAdmin 能 够 支持 管理 数据 库 、 表 格 、 字 段 、 联 系 、 索 引 、 
户 .许可 等 一 些 最 常用 的 操作 ,同时 还 可 以 直接 执行 任何 SQL 语句 。 


3. Aqua Data Studio 


对 于 数据 库 管 理 人 员 、 软 件 开发 人 员 以 及 业务 分 析 师 来 说 ,Aqua Data Studio 是 一 个 完 
整 的 集成 开发 环境 (IDE)。 它 主要 包括 数据 库 查询 和 管理 工具 ,数据 库 、 源 代码 管理 以 及 文 
件 系 统 的 比较 工具 ,为 SVN 和 CVS 设计 了 一 个 完整 的 集成 源 代码 管理 客户 端 ,提供 了 一 个 
强大 的 数据 库 建 模 工 具 。 


4. SOLyog 


SQLyog 是 一 个 全 面 的 MySQL 数据 库 管 理工 具 。 它 包含 了 开发 人 员 在 使 用 MySQL 
时 所 需 的 绝 大 部 分 功能 ,包括 查询 结果 集合 .查询 分 析 器 、 服 务 器 消息 .表格 数据 ,表格 信息 ， 
以 及 查询 历史 ,它们 都 以 标签 的 形式 显示 在 界面 上 ,开发 人 员 只 需 操 作 鼠 标 即 可 完成 任务 。 
此 外 , 它 还 可 以 方便 地 创建 视图 和 存储 过 程 。 

5. mytop 


mytop 是 一 款 基于 控制 台 的 工具 ,用 于 监视 线程 以 及 MySQL 3. 22. x、3. 23,x 和 4.x 
服务 器 的 整体 性 能 。mytop 的 灵感 来 自 系统 监视 工具 top。mytop 连接 到 MySQL 服务 器 
之 后 ,能 定期 运行 SHOW PROCESSLIST 和 SHOW STATUS 命令 ,并 以 一 种 有 用 的 格式 
总 结 从 这 些 命令 中 所 获得 的 信息 。 


6. MySOQL Sidu 


MySQL Sidu 是 一 款 免费 的 MySQL 客户 端 , 它 通过 网 络 浏 览 器 来 运行 ,这 款 工具 简单 
易学 。Sidu 这 几 个 字母 表示 Select( 选 择 ) ,Insert( 插 入 ) .Delete( 删 除 ) 和 Update( 更 新 )。 


7. Navicat Lite MySQL Admin Tool 


Navicat 是 一 款 非常 快速 、 可 靠 的 数据 库 管理 工具 ,受到 广大 用 户 的 普遍 欢迎 。Navicat 
专门 用 来 简化 数据 库 管理 并 且 减 少 管理 成 本 , 它 旨 在 满足 数据 库 管 理 人 员 数据 库 开发 人 员 
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以 及 广大 中 小 企业 的 需要 。Navicat 有 一 个 非常 直观 的 GUI, 可 以 使 用 户 安全 便捷 地 创建 、 
组 织 \ 访 问 以 及 分 享 信息 。 

对 于 MySQL 来 说 ,Navicat 工具 是 一 个 强大 的 数据 库 管理 和 开发 工具 。 它 可 以 跟 任 何 
版 本 的 MySQL 数据 库 服务 器 一 起 工作 ,并 且 支 持 MySQL 大 多 数 最 新 的 功能 ,包括 
Trigger Stored Procedure、.Function、Event, View 和 Manage User 等 。Navicat Lite 可 以 
免费 下 载 ,但 是 仅 适用 于 非 商 业 活动 。 


@.4 Sybase 


Sybase SQL Server 是 由 Sybase 公司 开发 的 具有 良好 性 能 、 高 可 靠 性 、 面 向 联机 事务 处 
理 的 可 编程 的 关系 型 数据 库 服务 器 。Sybase 主要 有 三 种 版 本 : 一 是 UNIX 操作 系统 下 运 
行 的 版 本 ,二 是 Novell Netware 环境 下 运行 的 版 本 ,三 是 Windows NT 环境 下 运行 的 版 本 。 
对 于 UNIX 操作 系统 ,目前 广泛 应 用 的 为 Sybase 10 及 Syabse 11 for SCO UNIX。 


9.4.1 Sybase 数据库 的 发 展 史 


1984 年 ,Mark B， Hiffman 和 Robert Epstern 创建 了 Sybase 公司 ,推出 了 支持 企业 范 
围 的 “客户 /服务 器 体系 结构 ?的 数据 库 。 吸 取 了 INGRES 的 研制 经 验 ,以 满足 联机 事务 处 
理应 用 的 要 求 , 于 1987 年 推出 了 Sybase SQL Server , 称 为 大 学 版 INGRES 的 第 三 代 产 品 。 
Sybase System 12. 5 是 其 最 新 产品 ,支持 企业 内 部 各 种 数据 库 应 用 需求 ,如 数据 仓库 .联机 
事务 处 理 ,决策 支持 系统 和 小 平台 应 用 等 。Sybase 的 产品 系列 事 括 了 数据 库 .开发 工具 、 集 
成 中 间 件 、 企 业 门 户 ,以 及 移动 无 线 服 务 器 等 。Sybase 的 企业 软件 解决 方案 适用 于 所 有 的 
技术 平台 , 极 大 地 保证 了 产品 的 兼容 性 ,真正 实现 了 Everything Works Better When 
Everything Works Together。 


9.4.2 Sybase 数据 库 的 特点 
1. 基于 客户 /服务 器 体系 结构 的 数据 库 


一 般 的 关系 数据 库 都 是 基于 主 / 从 式 的 模型 。 在 主 / 从 式 的 结构 中 ,所 有 的 应 用 都 运行 
在 一 台 机 器 上 。 用 户 只 是 通过 终端 发 命令 或 简单 地 查看 应 用 运行 的 结果 ,而 在 客户 /服务 器 
结构 中 ,应 用 被 分 在 了 多 台 机 器 上 运行 。 一 台 机 器 是 另 一 个 系统 的 客户 ,或 是 另外 一 些 机 器 
的 服务 器 。 这 些 机 器 通过 局 域 网 或 广域网 连接 起 来 ,好 处 是 支持 共享 资源 且 在 多 台 设 备 间 
平衡 负载 ,允许 容纳 多 个 主机 的 环境 ,充分 利用 了 企业 已 有 的 各 种 系统 。 


2. 真正 开放 的 数据 库 


由 于 采用 了 客户 /服务 器 结构 ,应 用 被 分 在 了 多 台 机 器 上 运行 。 更 进一步 ,运行 在 客户 
端的 应 用 不 必 是 Sybase 公司 的 产品 。 对 于 一 般 的 关系 数据 库 , 为 了 让 其 他 语言 编写 的 应 
能 够 访问 数据 库 , 提 供 了 预 编译 。Sybase 数据 库 , 不 只 是 简单 地 提供 了 预 编译 ,而 且 公开 了 
应 用 程序 接口 DB-LIB, 鼓 励 第 三 方 编写 DB-LIB 接口 。 由 于 开放 的 客户 DB-LIB 允许 在 不 
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同 的 平台 使 用 完全 相同 的 调用 ,因而 使 得 访问 DB-LIB 的 应 用 程序 很 容易 从 一 个 平台 向 另 
一 个 平台 移植 。 


3. 一 种 高 性 能 的 数据 库 


Sybase 真正 吸引 人 的 地 方 还 是 它 的 高 性 能 ,具体 体现 在 以 下 几 方 面 。 

(1) 可 编程 数据 库 

通过 提供 存储 过 程 , 创 建 了 一 个 可 编程 数据 库 。 存 储 过 程 允许 用 户 编写 自己 的 数据 库 
子 例 程 。 这 些 子 例 程 是 经 过 预 编 译 的 ,因此 不 必 为 每 次 调用 都 进行 编译 .优化 .生成 查询 规 
划 ,因而 查询 速度 要 快 得 多 。 

(2) 事件 驱动 的 触发 器 

触发 器 是 一 种 特殊 的 存储 过 程 。 通 过 触发 器 可 以 启动 另 一 个 存储 过 程 ,从 而 确保 数据 
库 的 完整 性 。 

(3) 多 线索 化 

Sybase 数据 库 体 系 结构 的 另 一 个 创新 之 处 就 是 多 线索 化 。 一 般 的 数据 库 都 依靠 操作 
系统 来 管理 与 数据 库 的 连接 。 当 有 多 个 用 户 连接 时 ,系统 的 性 能 会 大 幅度 下 降 。Sybase 数 
据 库 不 让 操作 系统 来 管理 进程 ,把 与 数据 库 的 连接 当 作 自己 的 一 部 分 来 管理 。 此 外 ,Sybase 
的 数据 库 引 擎 还 代替 操作 系统 来 管理 一 部 分 硬件 资源 ,如 端口 内存、 硬盘 , 绕 过 了 操作 系统 
这 一 环节 ,提高 了 性 能 。 


4. 扩充 性 能 


数据 库 服务 器 可 以 实现 从 只 有 少数 用 户 访问 的 数据 库 到 成 千 上 万 用 户 连接 的 服务 器 集 
成 系统 。 由 于 其 数据 库 服务 器 的 吞吐 量 和 响应 时 间 都 是 可 以 预测 的 ,因此 为 用 户 有 计划 地 
扩充 硬件 设备 提供 了 很 好 的 支持 。 


5. 高 可 用 性 


Sybase 的 数据 库 服务 器 的 高 可 用 性 表现 在 它 支 持 每 天 24 小 时 、 每 周 7 天 的 不 间断 运 
行 。 同 时 ,数据 库 所 具有 的 联机 高 速 备份 和 恢复 机 制 将 用 户 由 于 系统 故障 而 引起 的 损失 减 
少 到 最 小 程度 。 


Sybase 的 数据 完整 性 体现 在 以 下 方面 : 首先 , 它 通过 允许 用 户 使 用 存储 过 程 和 和 触发 器 
来 实现 对 用 户 数据 的 完整 性 控制 ; 另外 , 它 允 许 对 表 、 列 、 视 图 ,存储 过 程 、 命 令 等 对 象 进行 
授权 ,用 户 可 以 根据 需要 设 定 指定 的 用 户 或 组 是 否 具有 编辑 和 运行 权限 。 


7. 互 操作 性 


数据 库 的 互 操作 性 主要 表现 在 以 下 几 个 方面 : 

(1) 支持 多 种 互联 标准 。 

(2) 灵活 的 事务 语义 提供 .ANSI/ISO 事务 模式 选项 ,支持 ODBC 和 X/A 标准 ,支持 多 
网 络 协议 .支持 分 布 式 数据 库 管理 。 
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(3) 面向 开发 人 员 支 持 可 编程 的 两 个 阶段 提交 。 开 发 人 员 可 以 设置 错误 处 理 方式 ,而 
不 仅 局 限于 系统 缺 省 方式 。 


8. 管理 方便 


Sybase 的 事务 日 志 的 备份 非常 灵活 ,可 按照 规定 的 时 间 间 隔 进行 备份 ,这 样 用 户 可 以 
随时 根据 需要 恢复 任何 一 个 时 刻 的 数据 库 原型 。 另 一 方面 ,其 提供 的 远程 管理 方式 由 于 采 
的 是 中 央 集 中 式 对 远程 结 点 进行 管理 ,因此 用 户 可 以 直接 集中 对 远程 多 个 服务 器 进行 性 


9.4.3 Sybase 数据 库 的 组 成 


Sybase 数据 库 主 要 由 三 部 分 组 成 : 

(1) 进行 数据 库 管 理 和 维护 的 一 个 联机 的 关系 数据 库 管理 系统 Sybase SQL Server: 
Sybase SQL Server 是 个 可 编程 的 数据 库 管 理 系 统 , 它 是 整个 Sybase 产品 的 核心 软件 ,起 着 
数据 管理 ,高速 缓冲 管理 .事务 管理 的 作用 。 

(2) 支持 数据 库 应 用 系统 的 建立 与 开发 的 一 组 前 端 工具 Sybase SQL Toolset: ISQL 
是 与 SQL Server 进行 交互 的 一 种 SQL 句法 分 析 器 。ISQL 接收 用 户 发 出 的 SQL 语言 ,将 
其 发 送 给 SQL Server, 并 将 结果 以 形式 化 的 方式 显示 在 用 户 的 标准 输出 上 。 

DWB 是 数据 工作 台 , 是 Sybase SQL Toolset 的 一 个 主要 组 成 部 分 , 它 的 作用 在 于 使 用 
户 能 够 设置 和 管理 SQL Server 上 的 数据 库 , 并 且 为 用 户 提供 一 种 对 数据 库 的 信息 执行 添 
加 、 更 新 和 检索 等 操作 的 简便 方法 。 在 DWB 中 能 完成 ISQL 的 所 有 功能 , 且 由 于 DWB 是 
基于 窗口 和 菜单 的 ,因此 操作 比 ISQL 简单 ,是 一 种 方便 实用 的 数据 库 管理 工具 。 

APT 是 Sybase 客户 软件 部 分 的 主要 产品 之 一 ,也 是 从 事实 际 应 用 开发 的 主要 环境 。 
APT 工作 台 是 用 于 建立 应 用 程序 的 工具 集 ,可 以 创建 从 非常 简单 到 非常 复杂 的 应 用 程序 ， 
它 主要 用 于 开发 基于 表格 (Form) 的 应 用 。 其 用 户 界面 采用 窗口 和 菜单 驱动 方式 ,通过 一 系 
列 的 选择 完成 表格 (Form) .菜单 和 处 理 的 开发 。 

(3) 可 在 异 构 环境 下 把 其 他 厂商 的 应 用 软件 和 任何 类 型 的 数据 连接 在 一 起 的 接口 
Sybase Open Client/Open Server: 通过 Open Client 的 DB-LIB 库 ,应 用 程序 可 以 访问 SQL 
Server。 而 通过 Open Server 的 SERVER-LIB, 应 用 程序 可 以 访问 其 他 的 数据 库 管 理 系统 。 


9.4.4 Sybase 数据 库 的 开发 工具 
Sybase 为 用 户 提供 了 和 良好 的 开发 工具 和 开发 环境 ,支持 组 件 创建 和 快速 应 用 开发 。 


1. PowerBuilder 


PowerBuilder 是 一 个 可 视 化 的 客户 /服务 器 应 用 开发 工具 ,其 强大 的 功能 可 以 帮助 用 
户 快速 开发 复杂 的 应 用 ,并 且 它 还 提供 与 其 他 数据 库 的 接口 。 


2. Power Designer 


了 Power Designer 是 一 套 紧 密集 成 的 计算 机 辅助 软件 工程 (CASE) 工 具 , 用 于 为 复杂 的 
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数据 库 应 用 完成 分 析 、 设 计 、 维 护 、 建 立 文档 和 创建 数据 库 等 功能 。 


3. Power J 
Power J 是 基于 Java 应 用 的 快速 开发 工具 。 
4. Powre++ 


Powre++ 是 一 组 RAD C++ 客户 /服务 器 和 Internet 面向 对 象 的 开发 工具 。 


65 DB2 


DB2 是 IBM 公司 研制 的 一 种 关系 型 数据 库 系统 。DB2 主要 应 用 于 大 型 应 用 系统 ,具有 
较 好 的 可 伸缩 性 ,可 支持 从 大 型 机 到 单 用 户 环境 ,应 用 于 OS/2、Windows 等 平台 。DB2 提 
供 了 高 层次 的 数据 利用 性 、 完 整 性 ,安全 性 、 可 恢复 性 ,以 及 小 规模 到 大 规模 应 用 程序 的 执行 
能 力 , 具 有 与 平台 无 关 的 基本 功能 和 SQL 命令 。DB2 通用 数据 库 主要 组 件 包括 数据 库 引 擎 
应 用 程序 接口 和 一 组 工具 。 数 据 库 引擎 提供 了 关系 数据 库 管理 系统 的 基本 功能 ,包括 管理 
数据 控制 数据 的 访问 、 保 证 数据 完整 性 及 数据 安全 等 。 所 有 数据 访问 都 通过 SQL 接口 
进行 。 


9.5.1 DB2 的 发 展 历程 


DB2 是 IBM 公司 研制 的 一 种 关系 型 数据 库 管理 系统 ,分 别 在 不 同 的 操作 系统 平台 上 服 
务 。 从 最 初 的 研究 到 今天 的 DB2 9.DB2 这 个 数据 库 领域 里 的 佼佼 者 走 过 了 很 长 的 一 段 路 。 
1983 年 ,IBM 发 布 了 DATABASE 2(DB2)for MVS( 内 部 代号 为 Eagle)。1987 年 IBM 发 
布 了 OS/2 V1.0 扩展 版 ,这 是 IBM 第 一 次 把 关系 型 数据 库 处 理 能 力 扩展 到 微机 系统 ,这 也 
是 DB2 for OS/2、UNIX 和 Window 的 雏形 。1992 年 ,第 一 届 IDUG 欧洲 大 会 在 瑞士 日 内 
瓦 召开 ,这 一 重大 事件 标志 着 DB2 应 用 的 全 球 化 。1993 年 ,IBM 发 布 了 DB2 for OS/2 V1 
和 DB2 for RS/6000 V1, 这 是 DB2 第 一 次 在 Intel 和 UNIX 平台 上 出 现 。 之 后 的 研究 在 不 
断 地 进行 ,该 产品 也 在 不 断 地 改进 和 完善 。2006 年 IBM 发 布 DB2 9, 将 数据 库 领域 带 和 人 
XML 时 代 。XML 语言 以 其 可 扩展 性 、 与 平台 无 关 性 和 层次 结构 等 特性 ,成 为 构建 SOA 
(Service-Oriented Architecture) 时 不 同 应 用 间 进 行 数据 交换 的 主流 语言 。DB2 9 这 款 新 品 
最 大 的 特点 就 是 率先 实现 了 XML 和 关系 数据 间 的 无 缝 交互 ,而 无 须 考 虑 数据 的 格式 .平台 
或 位 置 。IBM DB2 9 是 IBM 在 数据 库 领 域 多 年 开发 项 目 最 重要 的 成 果 , 它 将 传统 的 静态 数 
据 库 技术 转变 为 交互 式 的 动态 数据 服务 器 ,使 用 户 能 够 更 好 地 管理 文档 、 视 频 和 音频 文件 、 
图 片 .网 页 等 所 有 类 型 的 信息 。 可 以 说 ,DB2 9 开创 了 一 个 新 的 XML 数据 库 时 代 。 

DB2 有 多 种 不 同 的 版 本 ,如 DB2 工作 组 版 (DB2Workgroup Edition) ,DB2 企业 版 (DB2 
Enterprise Edition ) 、DB2 个 人 版 (DB2 Personal Edition ) 和 DB2 企业 扩展 版 (DB2 
Enterprise-Expended Edition) 等 ,这 些 产品 基本 的 数据 管理 功能 是 一 样 的 ,它们 之 间 的 区 别 
在 于 支持 远程 客户 能 力 和 分 布 式 处 理 能 力 上 的 不 同 。 个 人 版 适合 于 单机 使 用 , 即 服务 器 只 
能 由 本 地 应 用 程序 访问 。 工 作 组 版 提供 了 本 地 和 远程 客户 访问 DB2 的 功能 ,当然 远程 客户 
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要 安装 相应 的 客户 应 用 程序 开发 部 件 。 企 业 版 不 仅 包括 工作 组 版 中 的 所 有 部 件 , 而 且 还 增 
加 了 对 主机 连接 的 支持 。 企 业 扩展 版 则 允许 将 一 个 大 的 数据 库 分 布 到 同一 类 型 的 多 个 不 同 
计算 机 上 ,这 种 分 布 式 功能 尤其 适用 于 大 型 数据 库 的 处 理 。 


9.5.2 DB2 的 特点 


DB2 数据 库 提供 了 高 层次 的 数据 利用 性 、 完 整 性 、 安 全 性 、 可 恢复 性 ,以 及 小 规模 到 大 
规模 应 用 程序 的 执行 能 力 , 具 有 与 平台 无 关 的 基本 功能 和 SQL 命令 。 


1. 支持 面向 对 象 的 编程 


DB2 支持 复杂 的 数据 结构 ,如 无 结构 文本 对 象 ,可 以 对 无 结构 文本 对 象 进行 布尔 匹配 、 
最 接近 匹配 和 任意 匹配 等 搜索 。 可 以 建立 用 户 数据 类 型 和 用 户 自 定义 函数 。 


2. 支持 多 媒体 应 用 程序 


DB2 支持 大 二 分 对 象 , 允 许 在 数据 库 中 存 取 二 进 制 大 对 象 和 文本 大 对 象 。 其 中 ,二 
制 大 对 象 可 以 用 来 存储 多 媒体 对 象 。 


3. 备份 和 恢复 能 力 


重新 启动 中 断 的 恢复 操作 ,可 以 在 数据 库 恢 复 时 节省 宝贵 的 时 间 , 同 时 简化 了 恢复 工 
作 。 支 持 重 定向 恢复 操作 ,在 现 有 备份 镜像 中 自动 生成 脚本 。 能 够 从 表 空 间 备份 镜像 中 重 
新 构建 数据 库 。 此 项 功能 让 DB2 的 恢复 更 加 灵活 和 多 样 化 ,同时 也 为 客户 提供 了 更 全 面 的 
恢复 解决 方案 。 


4. 查询 优化 


它 以 拥有 一 个 非常 完备 的 查询 优化 器 而 著称 。 其 外 部 连接 改善 了 查询 性 能 ,并 支持 多 
任务 并 行 查询 。 
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5. 分 布 式 数据 库 访问 


DB2 具有 很 好 的 网 络 支持 能 力 ,每 个 子 系统 都 可 以 连接 十 几 万 个 分 布 式 用 户 ,可 同时 
激活 上 千 个 活动 线程 ,对 大 型 分 布 式 应 用 系统 尤为 适用 。 


6. 支持 数据 复制 


9.5.3 DB2 的 开发 工具 
IBM 提供 了 许多 开发 工具 ,主要 有 visualizer ,visualage ,visualgen 等 几 种 。 


1. visualizer 


这 是 一 种 客户 /服务 器 环境 中 的 集成 工具 软件 ,主要 包括 visualizer query 可 视 化 查询 
工具 、visualizer ultimedia query 可 视 化 多 媒体 查询 工具 、visualizer chart 可 视 化 图 标 工 具 、 
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visualizer procedure 可 视 化 过 程 工具 ,visualizer statistics 可 视 化 统计 工具 、visualizer plans 
可 视 化 规划 工具 .visualizer development 可 视 化 开发 工具 。 


2. visualage 


它 是 一 个 功能 很 强 的 可 视 化 的 面向 对 象 的 应 用 开发 工具 ,可 以 大 幅度 地 提高 软件 开发 
效率 。 其 主要 特征 有 : 
。 可 视 化 程序 设计 工具 。 
部 件 库 。 
关系 数据 库 支持 。 
。 群体 程序 设计 。 
。 支持 增强 的 动态 连接 库 。 
。 支持 多 媒体 。 
。 支持 数据 共享 。 


3. visualgen 


visualgen 是 IBM 人 它 集 成 了 第 四 代 语 言 、 客 
户 / 服 务 器 与 面向 对 象 技术 ,给 用 户 提 供 了 一 个 完整 .高效 的 开发 环境 。 


9.5.4 应 用 程序 访问 DB2 的 实例 
以 下 是 C# 访问 示例 数据 库 的 表 Reader 的 一 个 小 例子 。 


// 连 接 数据 库 

/创建 DB2 的 数据 源 连 接 

OdbcConnection con = new OdbcConnection ("Dsn = DataSourceName; uid = UserName; pwd = 

mismidas"); 

// 使 用 DataSet 读 取 数据 

String strSQL = "SELECT Rno,Rname, Rank, Sex, Age FROM Reader"; 

OdbcDataAdapter da = new OdbcDataAdapter( strSQL, con); 

DataSet ds = new DataSet( ); 

da. Fill(ds, "Reader"); 

// 显 示 数 据 

String s=""; 

Foreach(DataRow dr in ds. Tables[0]. Rows) 

{s=s+" Rno:"+ dr["Rno"].ToString() +" Rname:" + dr["Rname"]. ToString() +" Rank:" + dr 
["Rank"].ToString() +" Sex:"+ dr["Sex"].ToString()+" Age:"+ dr["Age"].ToString() +""; 

} 

Labell. Text = s; 


@.6 本章 小 结 


数据 库 技术 的 发 展 ,已 经 成 为 先进 信息 技术 发 展 环节 中 一 个 相当 重要 的 组 成 部 分 ,是 现 
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代 计 算 机 信息 系统 和 计算 机 应 用 系统 的 基础 和 核心 。 随 着 科学 技术 的 发 展 ,计算 机 技术 不 
断 应 用 到 各 行 各 业 ,数据 存储 不 断 膨胀 的 需要 也 会 对 未 来 的 数据 库 技术 提出 更 高 的 要 求 。 
面 对 令 人 眼花 综 乱 的 数据 库 产品 市 场 ,应 当 根 据 个 人 或 企业 的 不 同 需 求 ,有 针对 性 地 选择 适 
合 自己 的 数据 库 产品 。 本 章 介绍 了 主流 数据 库 产品 中 SQL Server、Oracle、MySQL、 Sybase 
和 DB2 的 主要 特点 ,以 便 用 户 在 选择 数据 库 产品 时 有 所 侧重 。 


数据 库 技术 的 新 发 展 | 


数据 库 技术 从 20 世纪 60 年 代 中 期 产生 到 今天 仅 有 不 到 50 年 的 历史 ,但 其 发 展 速度 之 
快 、 使 用 范围 之 广 是 其 他 技术 望尘莫及 的 。 短 短 40 多 年 间 , 已 从 第 一 代 的 层次 和 网 状 数据 
库 系统 发 展 到 支持 关系 数据 模型 的 关系 数据 库 系统 ,我 们 称 之 为 第 二 代数 据 库 系统 ,再 进 一 
步 发 展 为 第 三 代 以 面向 对 象 模型 为 主要 特征 的 新 一 代数 据 库 系统 。 第 三 代数 据 库 系统 保持 
或 继承 了 第 二 代数 据 库 系统 的 技术 , 除 提供 传统 的 数据 管理 服务 外 ,第 三 代数 据 库 系 统 支 持 
更 加 丰富 的 对 象 结构 和 规则 , 集 数据 管理 、 对 象 管 理 和 知识 管理 于 一 体 。 同 时 ,数据 库 技术 
与 多 学 科技 术 在 发 展 的 过 程 中 有 机 结合 ,计算 机 领域 中 其 他 新 兴 技 术 的 发 展 对 数据 库 技术 
产生 了 重大 影响 。 传 统 的 数据 库 技术 与 网 络 通信 技术 、 人 工 智能 技术 ,面向 对 象 程序 设计 技 
术 、 并 行 计算 技术 等 互相 渗透 ,互相 结合 ,成 为 当前 数据 库 技术 发 展 的 一 个 主要 特征 , 随 之 
涌现 出 了 各 种 新 型 的 数据 库 系 统 。 另 一 方面 ,数据 库 技术 被 应 用 到 特定 的 领域 。 面 向 应 
领域 的 数据 库 技 术 的 研究 在 传统 数据 库 系统 基础 上 ,结合 各 个 应 用 领域 的 特点 ,研究 适合 i 
应 用 领域 的 数据 库 技术 ,如 数据 仓库 .工程 数据 库 、` 统 计数 据 库 . 科 学 数据 库 、 空 间 数据 库 、 
理 数 据 库 等 ,这 是 当前 数据 库 技术 发 展 的 又 一 重要 特征 。 


(i0,1 面向 对 象 的 数据 库 系 统 


面向 对 象 的 数据 库 是 基于 面向 对 象 数 据 模 型 的 新 一 代数 据 库 系统 。 把 数据 库 技术 与 面 
向 对 象 程序 设计 方法 相 结 合 形成 了 面向 对 象 的 数据 库 系统 (Object-Oriented database 
system,OODBS) 。 

传统 的 层次 、 网 状 和 关系 数据 库 在 许多 商业 数据 库 应 用 中 取得 了 极 大 成 功 , 然 而 在 设计 
和 实现 更 为 复杂 的 数据 库 应 用 时 ,传统 数据 库 系 统 暴露 出 了 一 些 缺 陷 。 在 设计 与 实现 科学 
实验 数据 库 、 电 信和 数据 库 、 地 理 信息 系统 数据 库 以 及 多 媒体 数据 库 的 时 候 出 现 了 新 的 应 用 要 
求 , 如 长 事务 的 处 理 、 图 像 或 大 文本 项 等 新 数据 类 型 的 存储 以 及 非 标 准 的 特殊 应 用 操作 。 传 
统 的 数据 库 操作 往往 不 能 满足 这 种 复杂 数据 库 应 用 的 要 求 。 

面向 对 象 程序 设计 方法 已 经 被 广泛 地 应 用 于 软件 工程 、 知 识 库 、 人 工 智 能 和 计算 机 系统 
等 领域 。 面 向 对 象 程序 设计 方法 和 数据 库 技术 的 结合 ,不 但 能 让 设计 者 定义 复杂 对 象 的 结 
构 , 还 能 让 设计 者 定义 作用 于 这 些 复杂 对 象 的 操作 ,从 而 能 够 有 效 地 支持 新 一 代数 据 库 的 
应 用 。 
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10.1.1 面向 对 象 数 据 库 系统 的 基本 特征 


数据 库 的 特征 依赖 于 实际 应 用 ,所 设计 的 数据 库 语 言 必 须 允 许 用 户 方便 地 使 用 这 些 特 
征 , 数 据 库 的 结构 也 应 能 有 效 地 支持 这 些 特征 。 面 向 对 象 数 据 库 系 统 区 别 于 传统 数据 库 系 
统 的 主要 特征 如 下 。 


1. 具有 表达 和 管理 对 象 的 能 力 


面向 对 象 数据 库 系统 应 该 具有 表达 和 管理 对 象 的 能 力 。 面 向 对 象 数 据 库 系统 通过 对 象 
及 它们 之 间 的 相互 联系 来 描述 现实 世界 。 它 应 该 支持 对 象 标识 ,使 得 对 象 的 存在 不 依赖 于 
本 身 的 值 ,而 只 依赖 于 它 的 标识 ,对 象 间 能 够 通过 对 象 标识 而 相互 区 分 。 类 的 层次 和 继承 是 
一 个 关键 的 概念 ,新 的 类 允许 从 以 前 定义 过 的 类 那里 继承 结构 和 操作 。 因 此 在 面向 对 象 数 
据 库 系统 中 ,新 的 对 象 类 型 可 以 简便 地 重用 已 有 的 类 型 定义 。 面 向 对 象 数据 库 系统 的 一 个 
问题 是 如 何 表示 对 象 间 的 联系 。ODMG 2. 0(Object Database Management Group ,对 象 数 
据 库 管理 组 ) 标 准 中 提出 用 一 对 反 向 引用 来 表示 二 元 关系 , 即 把 与 某 个 对 象 相关 的 对 象 的 标 
识 放 在 对 象 内 部 ,并 维护 参照 完整 性 。 


2. 具有 任意 复杂 度 的 对 象 结构 


面向 对 象 数据 库 系统 中 的 对 象 可 以 具有 任意 复杂 度 的 对 象 结 构 。 这 使 对 象 能 够 包含 所 
有 描述 该 对 象 的 必要 信息 。 传 统 数据 库 恰好 与 此 相反 , 它 把 关于 复杂 对 象 的 信息 分 散在 许 
多 关系 或 记录 中 ,从 而 表 失 了 现实 世界 的 对 象 与 数据 库 表 示 之 间 的 直接 对 应 关系 。 在 面向 
对 象 数据 库 系统 中 ,允许 逐步 细 化 复杂 实体 ,还 能 将 整个 复杂 对 象 或 其 子 集 作为 一 个 独立 的 
单位 ,可 以 在 某 一 时 刻 将 某 一 成 员 对 象 加 进去 。 


3. 具有 与 面向 对 象 编程 语言 交互 的 接口 


面向 对 象 数据 库 系 统 必 须 具 有 与 面向 对 象 编程 语言 交互 的 接口 。 面 向 对 象 程序 设计 
的 对 象 是 瞬 态 对 象 ,只 在 程序 执行 过 程 中 存在 。 而 面向 对 象 数据 库 可 以 延长 对 象 的 存在 ,把 
对 象 持久 地 存储 起 来 。 对 象 在 程序 结束 之 后 仍然 持续 存在 ,可 以 被 检索 或 被 其 他 程序 使 
面向 对 象 数据 库 系统 通过 与 面向 对 象 编程 语言 交互 的 接口 ， 可 以 提供 持久 化 对 象 和 共享 对 
象 的 能 力 , 从 而 允许 多 个 程序 和 应 用 共享 这 些 对 象 。 


bo 
UH 


4. 具有 表达 和 管理 数据 库 变化 的 能 力 


面向 对 象 数据 库 应 具有 表达 和 管理 数据 库 变化 的 能 力 。 管 理 同一 对 象 的 多 个 版 本 的 能 
力 对 于 设计 和 工程 应 用 而 言 是 至 关 重 要 的 。 一 个 对 象 的 旧版 本 代表 一 个 已 经 通过 测试 和 鉴 
定 的 设计 方案 ,那么 应 该 保存 这 个 版 本 直到 新 版 本 通过 测试 和 鉴定 。 除 了 允许 版 本 变化 外 ， 
面向 对 象 数 据 库 系统 也 应 该 允许 模式 演变 。 所 谓 模式 演变 是 指 类 的 声明 发 生 了 变化 ,或 创 
建 了 新 的 类 或 联系 。 

可 见 ,一 个 面向 对 象 数 据 库 系统 首先 应 是 一 个 数据 库 系统 ,同时 又 必须 具有 面向 对 象 的 
特征 。 
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10.1.2 面向 对 象 数据 模型 


面向 对 象 数据 模型 (Object-Oriented data model,OO 模型 ) 是 一 种 可 扩充 的 数据 模型 ， 
它 以 对 象 (实体 ) 为 基础 ,综合 了 语义 数据 模型 .知识 表达 数据 模型 中 的 一 些 基本 概念 ,借鉴 
了 面向 对 象 程序 设计 和 抽象 数据 模型 的 一 些 基 本 思想 ,支持 面向 对 象 分 析 和 设计 。 

目前 ,虽然 面向 对 象 数据 模型 还 没有 一 个 统一 的 标准 ,但 基本 包含 以 下 核心 概念 。 


1. 对 象 


E-R 模型 中 的 实体 在 OO 模型 中 都 是 对 象 (Object) 。 对 象 是 由 一 组 数据 结构 和 在 这 组 
数据 结构 上 的 操作 的 程序 代码 封装 起 来 的 基本 单位 。 

对 象 描述 包含 静态 和 动态 两 方面 的 内 容 , 即 对 象 的 结构 和 行为 。 在 OO 模型 中 ,对 象 的 
结构 和 行为 分 别 用 属性 和 方法 来 表示 。 

(1) 属性 

一 个 对 象 包含 若干 个 属性 (Attribute) ,用 以 描述 对 象 的 状态 .组 成 和 特征 。 这 些 属性 
的 值 就 构成 该 对 象 的 静态 描述 。 需 要 注意 的 是 ,在 面向 对 象 模型 中 ,属性 可 能 也 是 对 象 , 例 
如 一 个 计算 机 由 主机 、 显 示 器 、 键 盘 等 组 成 ,显示 器 、 键 盘 等 本 身 也 是 对 象 。 因 此 ,一 个 属性 
可 以 包含 其 他 的 对 象 ,这 样 引用 对 象 的 过 程 可 以 递归 下 去 ,从 而 组 成 各 种 复杂 的 对 象 。 一 个 
对 象 可 以 被 多 个 对 象 引 用 ,这 种 由 对 象 组 成 对 象 的 过 程 称 为 聚集 (Aggregation) 。 

(2) 方法 

对 象 除了 具有 静态 特征 之 外 还 具有 行为 特征 。 例 如 ,一 个 学 生 对 象 不 仅 包含 学 号 、. 姓 
名 ,性 别 、 身 高 ,体重 等 描述 静态 特征 的 属性 ,而 且 还 具有 上 课 、 考 试 等 行为 特征 。 因 此 除了 
属性 之 外 ,对 象 还 包括 若干 方法 (Method), 用 以 描述 对 象 的 行为 特征 。 方 法 可 以 改变 对 象 
的 状态 ,对 对 象 进行 各 种 操作 。 方 法 的 定义 包含 了 方法 的 接口 和 方法 的 实现 。 


2. 对 象 标识 


每 个 对 象 都 有 一 个 在 系统 内 唯一 的 、 不 变 的 标识 , 称 做 对 象 标 识 (Object Identifier)。 
所 有 的 对 象 者 具有 唯一 标识 并 且 是 可 区 分 的 ,这 个 “唯一 " 指 的 是 对 象 可 由 其 内 在 本 质 区 分 ， 
而 不 是 通过 它们 的 描述 性 质 来 区 分 。 对 象 标识 独立 于 对 象 的 内 容 ,一 般 由 系统 产生 ,用 户 不 
能 修改 。 对 象 标识 的 值 对 外 部 用 户 来 说 是 不 可 见 的 ,但 系统 会 在 内 部 用 这 个 值 唯一 地 标识 
每 个 对 象 ,并 用 这 个 值 创 建 和 管理 内 部 对 象 引 用 。 


3. 封装 和 消息 


封装 (Encapsulation) 是 OO 模型 中 的 一 个 关键 的 概念 。 每 一 个 对 象 都 是 其 属性 和 方法 
的 封装 ,封装 的 目的 在 于 两 方面 : 四 把 方法 的 调用 接口 和 实现 分 开 , 实 现 细 节 对 使 用 是 隐藏 
的 。 这 样 实现 部 分 的 修改 可 不 致 影响 接口 ,有 利于 数据 的 独立 性 。 四 对 象 封装 后 ,直接 受 对 
象 中 所 定义 的 操作 。 对 象 状 态 的 改变 只 能 通过 自身 的 方法 来 进行 。 外 界 程序 不 能 直接 访问 
对 象 的 属性 ,可 以 避免 许多 不 希望 发 生 的 副作用 ,有 利于 提高 程序 的 可 靠 性 。 

外 界 与 对 象 的 通信 一 般 只 能 借助 于 消息 (Message) 。 消 息 是 用 来 请 求 对 象 执行 某 一 处 
理 或 回答 某 些 信息 的 要 求 。 消 息 传递 给 对 象 , 调 用 对 象 的 相应 的 方法 进行 相应 的 操作 ,再 以 
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消息 的 形式 返回 操作 结果 。 消 息 传递 是 对 象 联系 的 唯一 方法 。 
4. 类 


具有 相同 的 属性 和 方法 的 所 有 对 象 构成 一 个 对 象 类 (Class) ,通常 称 做 类 。 类 中 的 每 个 
对 象 称 做 该 类 的 一 个 实例 。 例 如 ,如 果 把 学 生 定义 为 一 个 类 ,那么 某 个 学 生 就 是 学 生 类 中 的 
一 个 对 象 。 同 一 类 的 对 象 所 具有 的 相同 的 属性 和 方法 ,这 些 属性 和 方法 只 需要 在 类 中 定义 
一 次 ,而 不 必 在 每 个 对 象 中 重复 定义 。 任 何 对 象 都 属于 某 一 特定 的 类 。 

类 的 概念 类 似 于 关系 模式 ,类 的 属性 类 似 于 关系 模式 中 的 属性 ,对象 类 似 于 元 组 。 如 果 
把 类 本 身 看 做 一 个 对 象 , 则 称 之 为 类 对 象 。 与 类 对 象 相关 的 属性 集 和 方法 集 适用 于 该 类 对 
象 而 不 适用 于 该 类 实例 ,这 样 的 属性 和 方法 称 为 类 属性 、 类 方法 。 类 属性 是 描述 类 的 所 有 对 
象 的 共同 特征 的 属性 ,对 于 任何 对 象 实 例 , 它 的 属性 值 是 相同 的 。 例 如 学 生 类 的 属性 “学 生 
人 数 ”, 虽 然 它 和 每 个 学 生 有 关系 ,但 并 不 是 某 个 学 生 的 属性 ,而 是 学 生 类 的 属性 ,在 同一 时 
刻 , 对 于 每 个 学 生来 说 ,“ 学 生 人 数 ” 是 完全 相同 的 。 面 向 对 象 数 据 库 模式 是 类 的 集合 。 


5. 继承 
OO 模型 可 以 直接 表示 is-a 关系 。 如 果 A is-a B, 则 称 类 A 是 类 B 的 子 类 (Subclass)， 
称 类 B 是 类 A 的 超 类 (Superclass) 。 面 向 对 象 模型 的 这 种 超 类 和 子 类 间 的 关系 可 以 形成 一 
个 类 层次 结构 ,如 图 10-1 所 示 。 
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图 10-1 类 层次 结构 示例 


从 概念 上 说 ,类 层次 结构 从 上 至 下 是 一 个 特殊 化 的 过 程 ,反之 , 自 下 而 上 是 一 个 普遍 化 
的 过 程 。 图 10-1 所 表达 的 类 层次 结构 表明 直角 三 角形 和 正三 角形 都 是 三 角形 ,而 三 角形 、 
四 边 形 和 六 边 形 等 都 是 多 边 形 。 

在 面向 对 象 模 型 中 ,常用 的 有 单 继承 与 多 重 继承 两 种 继承 (Inheritance) 。 若 一 个 子 类 
只 能 继承 一 个 超 类 的 特性 ,这 种 继承 称 为 单 继承 ; 若 一 个 子 类 能 继承 多 个 超 类 的 特性 ,这 种 
继承 称 为 多 重 继承 (Multiple Inheritance) 。 

类 的 继承 带 来 了 很 多 好 处 , 子 类 在 继承 父 类 特性 的 同时 ,还 可 以 定义 自身 的 属性 、 方 法 ， 
并 可 剔除 掉 父 类 中 不 适合 子 类 的 操作 。 由 封装 和 继承 还 可 导出 面向 对 象 的 其 他 优良 特性 ， 
如 多 态 性 .动态 联 编 等 。 


10.1.3 面向 对 象 数 据 库 语 言 


面向 对 象 数据 库 语 言 用 于 描述 面向 对 象 数 据 库 的 模式 ,说 明 并 操纵 类 定义 与 对 象 实例 。 
与 关系 数据 库 的 标准 语言 SQL 类 似 , 面 向 对 象 数据 库 语言 主要 包括 对 象 定义 语言 和 对 象 操 
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纵 语 言 。 对 象 查询 语言 是 对 象 操纵 语言 的 一 个 重要 子 集 。 

面向 对 象 数据 库 语 言 一 般 应 具备 下 列 功 能 : 

(1) 类 的 定义 和 操纵 。 面 向 对 象 数 据 库 语言 可 以 操纵 类 ,包括 定义 、 生 成 、 存 取 \ 修 改 与 
撤销 类 。 其 中 类 的 定义 包括 定义 类 的 属性 、 操 作 特 征 、 继 承 性 与 约束 等 。 

(2) 操作 /方法 的 定义 。 面 向 对 象 数 据 库 语 言 可 用 于 对 象 操作 /方法 的 定义 与 实现 。 在 
操作 实现 中 ,语言 的 命令 可 用 于 操作 对 象 的 局 部 数据 结构 。 对 象 模型 中 的 封装 性 允许 操作 / 
方法 由 不 同 程序 设计 语言 来 实现 ,并 且 隐 藏 不 同 程序 设计 语言 实现 的 事实 。 

(3) 对 象 的 操纵 。 面 向 对 象 数据 库 语 言 可 以 用 于 操纵 实例 对 象 。 

对 象 数据 库 管理 组 织 (Object Database Management Group,ODMG) 是 面向 对 象 数据 
库 管理 系统 软件 商 的 国际 联盟 ,成 立 于 1991 年 ,并 于 1993 年 发 布 第 一 版 标准 , 即 ODMG-93 
或 者 ODMG 1.0。 但 当时 外 界 对 于 该 标准 的 评价 并 不 高 ,很 多 人 甚至 认为 它 根本 不 能 称 为 
一 个 “标准 ”, 至 多 只 能 称 为 一 个 关于 面向 对 象 数 据 库 语言 的 “提议 "集合 。 但 此 后 ODMG 
广泛 采纳 各 方面 对 于 标准 的 意见 ,快速 推出 了 多 个 改进 版 本 。 发 展 到 ODMG 3. 0 时 已 经 被 
广泛 认可 为 一 个 比较 成 熟 的 关于 面向 对 象 数 据 库 的 标准 了 。ODMG 标准 是 在 面向 对 象 数 
据 库 和 对 象 关 系数 据 库 逐渐 取代 纯 关 系 型 数据 库 成 为 市 场 和 研究 的 新 宠 的 背景 下 诞生 的 。 
它 规范 和 引导 对 象 数据 库 市 场 , 以 解决 由 于 缺少 标准 而 造成 各 种 对 象 数据 库 产品 间 缺 乏 可 
移植 性 的 问题 。ODMG 对 象 模型 是 从 OMC 对 象 模型 继承 演变 而 来 的 , 它 是 ODMG 标准 
的 核心 。ODMG 对 象 模型 主要 提供 了 数据 类 型 .类 型 构造 器 以 及 其 他 一 些 可 以 用 对 象 定义 
语言 来 说 明 对 象 数据 库 模式 的 概念 , 它 是 对 象 定 义 语 言 和 对 象 查询 语言 的 基础 。 

对 象 定义 语言 用 来 定义 符合 对 象 模型 的 对 象 类 型 。 值 得 重视 的 是 , 它 是 ODMG 实现 
可 移植 性 的 主要 方法 。 对 象 定义 语言 被 设计 为 支持 ODMG 对 象 模型 的 语义 结构 ,并 且 独 
立 于 任何 特定 的 编程 语言 。 它 的 主要 用 途 是 创建 对 象 说 明 ,也 就 是 类 和 接口 。 因 此 对 象 定 
义 语 言 不 是 一 种 完全 的 编程 语言 。 用 户 可 以 独立 于 任何 编程 语言 在 对 象 定义 语言 中 指定 一 
种 数据 库 模 式 , 然 后 使 用 特定 的 语言 绑 定 来 指明 如 何 将 对 象 定义 语言 结构 映射 到 特定 编程 
语言 的 结构 ,如 C++ ,SMALLTALK 和 Java。 

对 象 查询 语言 是 专门 为 ODMG 对 象 模型 指定 的 查询 语言 。 对 象 查询 语言 被 设计 为 能 与 
编程 语言 紧密 配合 使 用 。 这 些 编程 语言 有 一 个 ODMG 绑 定 的 定义 ,如 C++、SMALLTALK 和 
Java。 这 样 , 戏 入 某 种 编程 语言 的 一 个 对 象 查询 语言 的 查询 ,可 以 返回 与 那 种 语言 的 类 型 系 
统 相 匹配 的 对 象 。 对 于 查询 而 言 ,对 象 查询 语言 的 语法 和 关系 型 标准 查询 语言 SQL 的 语法 
相似 ,只 是 增加 了 有 关 对 象 的 特征 ,如 对 象 标识 、 复 杂 对 象 .操作 .继承 和 多 态 性 。 

面向 对 象 数据 库 语 言 是 面向 对 象 数据 库 区 别 于 传统 数据 库 的 一 个 重要 特征 。 但 面向 对 
象 数据 库 语言 的 查询 功能 很 弱 , 这 是 因为 用 变量 引用 对 象 的 方式 不 能 对 对 象 进行 统一 管理 。 
例如 ,图 书 作为 类 ,作者 是 属性 。 面 向 对 象 数据 库 语 言 可 从 每 一 本 书 的 对 象 找到 它 的 所 有 作 
者 ,但 不 支持 另 一 方向 的 查询 , 即 从 作者 查询 他 的 所 有 作品 ,除非 把 作者 也 定义 成 一 个 类 , 同 
时 把 作品 设置 成 属性 ,这 样 的 设计 将 在 数据 库 中 造成 元 余 ,为 此 就 有 必要 扩充 面向 对 象 数据 
库 语言 的 查询 功能 。 

数据 库 系 统 从 网 状 模型 到 关系 模型 的 进步 ,使 数据 库 查 询 语言 从 用 户 导 航 式 的 过 程 性 
语言 进入 到 了 由 系统 自动 选择 查询 路 径 的 非 过 程 性 语言 。 但 是 非 过 程 性 语言 的 面向 集合 的 
操作 方式 又 与 高 级 程序 设计 语言 的 面向 单个 数据 的 操作 方式 之 间 产 生 了 不 协调 现象 ,俗称 
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“阻抗 失 配 ”。 阻 抗 失 配 的 根本 原因 在 于 关系 数据 库 的 数据 模型 和 程序 设计 语言 不 一 致 。 因 
而 ,对 嵌入 式 数据 库 语 言 来 说 ,不 可 避免 地 会 产生 阻抗 失 配 。 但 面向 对 象 数据 库 不 同 , 它 的 
数据 模型 概念 来 自 面向 对 象 的 程序 设计 方法 ,因此 作为 某 一 面向 对 象 的 程序 设计 语言 扩充 
的 面向 对 象 数 据 库 语言 ,能 够 从 根本 上 解决 阻抗 失 配 问题 。 

商业 的 关系 型 数据 库 管 理 系统 成 功 的 一 个 原因 在 于 SQL 标准 。 对 象 数据 库 管理 组 织 
提出 的 ODMG 1.0 到 ODMG 3.0 标准 包含 了 对 象 定 义 语言 和 对 象 操纵 语言 。 但 是 目前 还 
没有 一 个 关于 面向 对 象 数据 语言 的 标准 能 够 像 SQL 标准 那样 得 到 业界 的 普遍 支持 。 
ODMG 标准 还 有 待 于 扩展 和 完善 ,比如 用 视图 概念 扩展 ODMG 等 。 标 准 的 建立 是 在 尝试 
和 探索 中 前 进 的 。 作 为 一 个 开放 性 的 组 织 , 需要 新 的 公司 和 学 术 研 究 团体 不 断 加 入 进来 ， 
才能 保持 ODMG 旺盛 的 生命 力 。 


10.1.4 对 象 关 系数 据 库 


在 今天 的 商业 领域 中 ,有 许多 可 用 的 数据 库 管 理 系统 产品 , 占 统治 地 位 的 主要 有 两 个 : 
关系 数据 库 系 统 和 面向 对 象 数据 库 系 统 , 分 别 支持 关系 数据 模型 和 对 象 数据 模型 。 数 据 库 
管理 系统 产品 的 另外 两 种 主要 类 型 是 层次 数据 库 和 网 状 数据 库 , 它 们 分 别 基于 层次 和 网 状 
数据 模型 。 随 着 数据 库 技术 的 发 展 ,后 两 种 数据 库 系 统 会 逐渐 被 前 两 种 所 取代 。 

数据 库 系 统 面 临 着 许多 领域 新 的 应 用 的 挑战 ,如 音频 和 视频 处 理 系统 中 的 数字 化 信息 、 
计算 机 辅助 桌面 排版 系统 中 的 大 文本 、 人 造 卫星 成 像 或 天 气 预报 中 的 图 像 .股票 市 场 交易 历 
史 中 的 时 间 序 列 数据 ,以 及 地 图 数据 中 的 空间 和 地 理 数 据 。 显 然 需 要 设计 某 些 数据 库 ,它们 
可 以 开发 ,操纵 和 维护 来 自 这 些 应 用 的 复杂 对 象 。 

在 面 对 上 述 复杂 应 用 时 ,基本 关系 模型 及 其 SQL 语言 的 早期 版 本 被 证 明 是 不 适用 的 。 
层次 数据 模型 可 以 很 好 地 适用 于 组 织 自然 中 存在 的 分 层 结构 ,但 它 在 数据 中 的 内 置 层次 路 
径 上 过 于 局 限 和 固定 ; 网 状 数据 模型 可 以 明确 地 对 联系 建 模 ,但 在 实现 方面 却 需 要 使 用 大 
量 的 指针 ,而 且 不 具备 对 象 标 识 ,继承 和 封装 这 类 概念 ,也 不 支持 多 种 数据 类 型 和 复杂 对 象 。 
因此 产生 了 一 种 趋势 一 一 将 对 象 数 据 模型 中 的 特征 和 语言 结合 到 关系 数据 模型 中 ,这 样 就 
扩展 了 关系 数据 模型 ,形成 了 对 象 关 系数 据 库 系统 ,使 它 能 够 处 理 当 今 复杂 的 应 用 。 

对 象 关系 数据 模型 扩展 关系 数据 模型 的 方式 是 提供 一 个 包括 复杂 数据 类 型 和 面向 对 象 
的 更 丰富 的 类 型 系统 。 关 系 查询 语言 也 需要 做 相应 的 扩展 以 处 理 这 些 更 丰富 的 类 型 系统 。 
对 象 关 系数 据 库 系统 以 对 象 关系 数据 模型 为 基础 ,为 想 要 使 用 面向 对 象 特征 的 关系 数据 库 
用 户 提供 了 一 个 方便 的 迁移 途径 。 


1. 账 套 关系 


关系 数据 理论 中 定义 了 第 一 范式 , 它 要 求 所 有 的 属性 都 具有 原子 域 。 原 子 域 指 这 个 域 
中 的 元 素 是 不 可 再 分 的 单元 。 然 而 并 非 所 有 的 应 用 都 用 第 一 范式 关系 建 模 最 好 。 例 如 , 某 
些 应 用 的 用 户 将 数据 库 视 为 一 个 对 象 的 集合 ,而 不 是 一 个 记录 的 集合 ,这 些 对 象 可 能 需要 
数 条 记录 来 表示 。 一 个 简单 易 用 的 界面 要 求 用 户 直观 概念 上 的 一 个 对 象 与 数据 库 系 统 概念 
上 的 一 个 数据 项 之 间 是 一 一 对 应 的 关系 。 

嵌 套 关系 模型 是 关系 模型 的 一 个 扩展 , 域 可 以 是 原子 的 也 可 以 赋值 为 关系 。 元 组 在 一 
个 属性 上 的 取 值 可 以 是 一 个 关系 ,于 是 关系 可 以 存储 在 关系 中 ,从 而 形成 了 关系 的 嵌 套 。 这 
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样 ,一 个 复杂 的 对 象 就 可 以 用 嵌 套 关系 的 单个 元 组 来 表示 。 如 果 将 说 套 关 系 的 一 个 元 组 视 
为 一 个 数据 项 ,在 数据 项 和 用 户 数据 库 观念 上 的 对 象 之 间 就 有 了 一 一 对 应 的 关系 。 


2. 复杂 类 型 


嵌 套 关系 只 是 基本 关系 模型 扩展 的 一 个 实例 ,其 他 非 原子 数据 类 型 ,如 嵌 套 记录 ,同样 
已 被 证 明 是 有 用 的 。 面 向 对 象 数据 模型 已 经 导致 了 对 对 象 的 继承 和 引用 等 特征 的 需求 。 有 
了 复杂 对 象 系统 和 面向 对 象 ,就 能 够 直接 表达 ER 模型 的 一 些 概念 ,如 实体 标识 、 多 值 属 
性 ,一 般 化 和 特殊 化 ,而 不 再 需要 经 过 关系 模型 的 复杂 转化 。 


3. 继承 .引用 类 型 


这 里 的 介绍 是 基于 SQL-99 标准 的 ,不 过 也 会 提 到 一 些 在 这 个 标准 中 没有 出 现 但 在 
SQL 标准 的 未 来 版 本 中 会 引入 的 一 些 特征 。 

继承 可 以 在 类 型 的 级 别 上 进行 ,也 可 以 在 表 的 级 别 上 进行 。 首 先 考虑 类 型 的 继承 ,再 假 
定 需要 在 数据 库 中 对 那些 是 学 生 或 教师 的 人 分 别 存储 一 些 额 外 的 信息 。 

SQL-99 只 支持 单 继承 , 即 一 个 类 型 只 能 继承 一 种 类 型 。 

面向 对 象 的 程序 设计 语言 提供 了 应 用 对 象 的 能 力 ,类 型 的 一 个 属性 可 以 是 对 一 个 指定 
类 型 的 对 象 的 引用 。 


4. 与 复杂 类 型 有 关 的 查询 


与 复杂 类 型 有 关 的 查询 可 以 分 为 如 下 几 类 : 路 径 表 达 式 、 以 集合 体 为 值 的 属性 \ 嵌 套 与 
解除 嵌 套 。 


5. 函数 与 过 程 


对 象 关 系数 据 库 系统 中 允许 用 户 定义 函数 与 过 程 ,它们 既 可 以 用 某 种 数据 操纵 语言 (如 
SQL) 来 定义 ,也 可 以 通过 外 部 的 程序 设计 语言 来 定义 ,如 Java、C 或 Ct++。 有 些 数 据 库 管理 
系统 支持 它们 自己 的 过 程 语言 ,如 Oracle 中 的 PL/SQL 和 Microsoft SQL Server 中 的 
Transact-SQL ,它们 类 似 于 SQL 有 关 过 程 的 部 分 ,但 在 语法 和 语义 上 有 所 区 别 ,详细 信息 可 
参见 各 自 的 系统 手册 。 


6. 面向 对 象 与 对 象 关系 


在 持久 化 程序 设计 语言 上 的 面向 对 象 数据 库 和 建立 在 关系 模型 之 上 的 面向 对 象 的 对 象 
关系 数据 库 在 数据 库 系 统 市 场 上 都 存在 ,数据 库 设 计 者 要 选择 适合 应 用 需求 的 系统 。 

程序 设计 语言 的 持久 化 扩展 和 对 象 关 系 系统 有 着 不 同 的 市 场 目 标 。SQL 语言 的 声明 
性 特征 和 有 限 的 能 力 为 防止 程序 设计 错误 对 数据 造成 破坏 提供 了 很 好 的 保护 ,同时 使 得 一 
些 高 级 优化 ,如 减少 1/O, 变 得 相对 简单 。 对 象 关系 系统 的 目标 在 于 通过 使 用 复杂 数据 类 型 
来 简化 数据 建 模 和 查询 ,典型 的 应 用 有 复杂 数据 的 存储 和 查询 等 。 

然而 ,对 于 某 些 类 型 的 应 用 ,如 主要 在 内 存 中 运行 和 对 数据 库 进 行 大 批量 访问 的 应 用 来 
说 ,一 个 说 明 性 语言 (如 SQL) 会 带 来 显著 的 性 能 损失 。 满 足 应 用 的 高 性 能 要 求 就 是 持久 化 
程序 设计 语言 的 目标 。 持 久 化 程序 设计 语言 提供 了 对 持久 数据 的 低 开销 存 取 ,并 且 取 消 了 
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数据 转换 要 求 。 但 是 ,持久 化 程序 设计 语言 对 由 于 程序 错误 而 引起 的 数据 破坏 更 为 敏感 ,而 
且 通 常 没 有 强大 的 查询 能 力 。 其 典型 应 用 包括 CAD 数据 库 。 


(10,2 分 布 式 数据 库 系统 


10.2.1 数据 库 系统 体系 结构 


数据 库 系 统 是 数据 密集 型 应 用 的 核心 ,其 体系 结构 受 数据 库 运 行 所 在 的 计算 机 系统 的 
影响 很 大 ,尤其 受 计算 机 体系 结构 中 的 联网 ,并行 和 分 布 的 影响 。 从 数据 库 管 理 系统 的 角度 
看 ,数据库 系统 体系 结构 一 般 采用 外 模式 、 模 式 和 内 模式 的 三 级 模式 结构 ; 从 最 终 用 户 的 角 
度 看 ,数据库 系统 体系 结构 分 为 集中 式 、 分 布 式 、 客 户 /服务 器 和 并 行 结 构 。 


1. 集中 式 数据 库 系 统 


集中 式 数据 库 系 统 是 由 一 个 处 理 器 ,与 它 相 关联 的 数据 存储 设备 以 及 其 他 外 围 设备 组 
成 , 它 被 物理 地 定义 到 单个 位 置 。 系 统 提供 数据 处 理 能 力 , 用 户 可 以 在 同样 的 站 点 上 操作 ， 
也 可 以 在 地 理 位 置 隔 开 的 其 他 站 点 上 通过 远程 终端 来 操作 。 系 统 及 其 数据 管理 被 某 个 或 中 
心 站 点 集中 控制 。 分 时 系统 环境 下 的 集中 式 数据 库 系统 结构 诞生 于 20 世纪 60 年 代 中 期 。 
当时 的 硬件 和 操作 系统 决定 了 分 时 系统 环境 下 的 集中 式 数据 库 系统 结构 成 为 早期 数据 库 技 
术 的 首选 结构 。 在 这 种 系统 中 ,不 但 数据 是 集中 的 ,而 且 数据 的 管理 也 是 集中 的 。 数 据 库 系 
统 的 所 有 功能 ,从 形式 的 用 户 接口 到 DBMS 核心 都 集中 在 DBMS 所 在 的 计算 机 上 。 目 前 ， 
大 多 数 关系 DBMS 产品 都 是 从 这 种 系统 结构 发 展 起 来 的 ,这 种 系统 现在 仍然 有 人 在 使 用 。 


2. 客户 /服务 器 数据 库 体系 结构 


客户 /服务 器 数据 库 体系 结构 由 客户 端 和 服务 器 端 迎 辑 组 件 构成 。 客 户 端 一 般 是 个 人 
电脑 或 工作 站 ,而 服务 器 端 是 大 型 工作 站 、 小 型 计算 机 系统 或 大 型 计算 机 系统 。 站 在 最 终 用 
户 的 角度 看 ,采用 客户 /服务 器 (Client/Server,C/S) 体 系 结构 后 ,可 以 使 某 些 任务 在 服务 器 
上 执行 , 另 一 些 任务 在 客户 机 上 执行 。 采 用 客户 /服务 器 结构 后 ,数据 库 系 统 功 能 分 为 前 端 
和 后 端 。 前 端 主要 包括 图 形 用 户 界面 ,表格 生成 和 报表 处 理 等 工具 ; 后 端 负责 存 取 结构 、 查 
询 计 算 和 优化 、 并 发 控制 以 及 故障 恢复 等 。 前 端 与 后 端 通过 SQL 或 应 用 程序 来 接口 。 客 
户 / 服 务 器 架构 是 开放 系统 架构 的 一 部 分 ,在 开放 系统 架构 里 ,所 有 计算 硬件 、 操 作 系统 、 网 
络 协议 和 其 他 软件 相互 连接 形成 网 络 并 共同 工作 实现 用 户 目 标 。 它 非常 适用 于 联机 事务 处 
理 和 决策 支持 应 用 , 它 往往 产生 很 多 相关 的 小 事务 并 要 求 高 度 的 并 发 性 。 采 用 客户 /服务 器 
体系 结构 的 主要 特点 是 客户 机 与 服务 器 之 间 的 职责 明确 ,客户 机 主要 负责 数据 表示 服务 ,而 
服务 器 主要 负责 数据 库 服 务 。 与 集中 式 系统 相 比 ,客户 /服务 器 数据 库 系统 更 为 灵活 。 

开放 式 数 据 库 连 接 (Open Database Connectivity,ODBC) 和 Java 程序 数据 库 连接 (Java 
Database Connectivity,JDBC) 标 准 定义 了 应 用 程序 和 数据 库 服 务 器 通信 的 方法 ,也 就 是 定 
义 了 应 用 程序 接口 。 应 用 程序 可 以 用 其 打开 与 数据 库 的 连接 ,发 送 查 询 和 更 新 以 及 获取 返 
回 结果 等 。 

数据 服务 器 系统 中 的 客户 与 服务 器 之 间 具 有 高 速 的 连接 ,客户 机 的 处 理 能 力 与 服务 器 


数据 库 原理 


相当 ,并 且 要 执行 的 任务 是 计算 密集 型 的 。 在 这 样 的 环境 中 ,所 有 的 功能 都 要 放 在 客户 端 ， 
数据 被 传送 到 客户 机 ,由 客户 机 进行 所 有 处 理 , 再 将 结果 传 回 到 服务 器 端 。 由 于 客户 机 与 服 
务 器 之 间 通 信 的 时 间 代 价 与 本 地 存储 器 引用 的 代价 相 比 要 高 得 多 ,所 以 在 实际 应 用 中 需要 
注意 这 方面 的 问题 。 


3. 分 布 式 数据 库 系 统 


分 布 式 数据 库 系统 是 计算 机 网 络 技术 与 数据 库 技 术 互相 渗透 和 有 机 结合 的 产物 。 分 布 
式 数据 库 系统 在 许多 情形 下 与 客户 /服务 器 架构 类 似 , 它 们 都 使 用 多 个 计算 机 系统 以 及 用 户 
能 够 访问 远程 系统 的 数据 。 然 而 ,分 布 式 数据 库 系统 可 以 更 好 地 实现 数据 共享 ,超过 了 客 
户 / 服 务 器 系统 可 以 达到 的 程度 。 分 布 式 数据 库 系统 包括 物理 上 分 布 . 巡 辑 上 集中 的 分 布 式 
结构 和 物理 上 逮 辑 上 都 分 布 的 分 布 式 数据 库 结构 两 种 。 前 者 的 指导 思想 是 : 把 数据 模式 
( 称 为 全 局 数据 模式 ) 按 数据 来 源 和 用 途 , 合 理 地 分 布 在 系统 的 多 个 结 点 上 ,使 大 部 分 数据 可 
以 就 地 或 就 近 存 取 。 数 据 在 物理 上 分 布 后 ,由 系统 统一 管理 ,使 用 户 感觉 不 到 数据 的 分 布 。 
后 者 一 般 由 两 部 分 组 成 : 一 是 本 结 点 的 数据 模式 ,二 是 本 结 点 共享 的 其 他 结 点 上 的 有 关 数 
据 模式 。 结 点 间 的 数据 共享 由 双方 协商 确定 ,这 种 数据 库 结构 有 利于 数据 库 的 集成 .扩展 和 
重新 配置 。 


4. 并 行 数据 库 系统 


并 行 体系 结构 的 数据 库 系 统 由 多 个 物理 上 连 在 一 起 的 中 央 处 理 单元 (CPU) 和 并 行 的 
数据 存储 设备 组 成 。 因 此 ,它们 提高 了 处 理 能 力 和 输入 /输出 速度 。 而 分 布 式 系统 的 各 个 
CPU 在 地 理 上 是 分 开 的 。 并 行 体系 结构 的 数据 库 类 型 分 为 共享 内 存 式 多 处 理 器 和 无 共享 
式 并 行 体系 结构 。 并 行 数据 库 系统 用 于 必须 要 对 非常 大 的 数据 库 进行 查询 的 应 用 或 者 是 每 
秒 钟 必 须 处 理 大 量 事务 的 应 用 。 在 并 行 数据 库 系 统 里 ,吞吐 量 和 响应 时 间 是 非常 高 的 。 并 
行 数 据 库 系统 的 主要 缺点 在 于 ,在 并 行 数据 库 系统 中 ,存在 初始 化 单个 进程 相关 的 启动 代 
价 ,而且 启动 时 间 可 能 掩盖 实际 的 处 理 时 间 , 反 过 来 又 会 影响 加 速 。 而 且 , 由 于 在 并 行 系统 
中 执行 的 进程 经 常 访 问 共享 资源 ,因此 在 新 的 进程 与 现 有 进程 竞争 共享 资源 时 ,就 会 产生 干 
扰 ,使 速度 下 降 。 


10.2.2 分 布 式 数据 库 系 统 的 概念 和 特点 
1. 分 布 式 数据 库 系统 的 概念 


分 布 式 数据 库 系 统 (Distributed Database System .DDBS) 是 针对 地 理 上 分 散 , 而 管理 上 
又 需要 不 同 程度 集中 管理 的 需求 而 提出 的 一 种 数据 管理 信息 系统 。 在 明确 给 出 分 布 式 数据 
库 的 定义 之 前 , 先 介 绍 一 下 一 般 的 分 布 式 数据 库 系 统 的 组 成 .如 图 10-2 所 示 。 

可 以 看 出 ,分 布 式 数据 库 系统 首先 是 由 多 个 不 同 结 点 或 场地 的 数据 库 系 统 通 过 网 络 连 
接 而 成 的 (如 不 加 特别 说 明 ,本 章 中 的 场地 和 结 点 表示 同一 含义 ) ,每 个 结 点 都 有 各 自 的 局 部 
数据 库 管 理 系统 (Local Database Management System.LDBMS) ,同时 还 有 全 局 数据 库 管 理 
系统 (Global Database Management System,GDBMS) 。 图 10-2 中 的 局 部 用 户 是 针对 某 一 
个 结 点 而 言 的 ,局 部 用 户 只 关心 他 所 访问 的 结 点 上 的 数据 ,而 全 局 用 户 则 可 能 需要 访问 多 个 
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结 点 上 的 数据 。 每 个 结 点 上 的 LDBMS 响应 局 部 用 户 的 应 用 请 求 ,GDBMS 则 为 全 局 
提供 服务 ,全 局 用 户 可 以 从 任意 一 个 结 点 访问 分 布 式 数据 库 系统 中 的 数据 。 


从 概念 上 讲 ,分 布 式 数据 库 是 由 一 组 数据 组 成 的 ,这 组 数据 分 布 在 计算 机 网 络 的 不 同 ; 


算 机 上 ,网 络 中 的 每 个 结 点 具有 独立 处 理 的 能 力 ( 称 为 场地 自治 ), 可 以 执行 局 部 应 
时 ,每 个 结 点 也 能 通过 网 络 通信 子 系统 执行 全 局 应 用 。 

满足 下 列 条 件 的 数据 库 系统 被 称 为 完全 分 布 式 数 据 库 系统 。 

(1) 分 布 性 , 即 数据 存储 在 多 个 不 同 的 结 点 上 。 

(2) 逻辑 相关 性 , 即 数据 库 系统 内 的 数据 在 逻辑 上 具有 相互 关联 的 特性 。 

(3) 场地 透明 性 ,即使 用 分 布 式 数据 库 中 的 数据 时 无 须 指明 数据 所 在 的 位 置 。 

(4) 场地 自治 性 , 即 每 一 个 单独 的 结 点 能 够 执行 局 部 的 应 用 请 求 。 

分 布 式 数据 库 系统 的 分 布 性 可 以 让 人 们 区 分 单一 的 集中 式 数 据 库 与 分 布 式 数据 库 ， 
根据 逻辑 相关 性 ,可 以 将 分 布 式 数据 库 与 一 组 局 部 数据 库 或 存储 在 计算 机 网 络 中 不 同 结 
的 文件 系统 区 分 开 来 。 场 地 的 透明 性 和 场地 的 自治 性 则 可 以 和 多 机 处 理 系 统 或 并 行 系统 
分 开 来 。 


局 部 用 户 全 局 应 用 


1 1 1 1 
1 数据 库 1 | ! 数据 库 3 | 
1 1 1 1 
1 1 1 1 
1 | LDBMS | GDBMS | ! 1 | LDBMS | GDBMS | ! 
| Wp = 三 二 二 二 三 二 2 二 过 下 三 二 二 一 J 
局 部 用 户 全 局 用 户 局 部 用 户 全 局 用 户 


图 10-2 分 布 式 数据 库 系 统 组 成 


2. 分 布 式 数据 库 的 特点 


分 布 式 数据 库 系统 是 传统 集中 式 数 据 库 系统 的 发 展 ,因此 它 具 有 集中 式 数据 库 系统 的 
桂 点 。 同 时 , 它 的 分 布 性 又 使 这 些 特点 具有 新 的 含义 。 传 统 的 数据 库 系统 针对 文件 系统 的 
弱点 ,采用 了 集中 控制 以 实现 数据 共享 ,这 是 其 最 主要 的 特色 。 对 于 分 布 式 数据 库 系统 来 


说 ,由 于 数据 的 分 散 性 ,分 布 式 数据 库 系 统 具 有 分 散 与 集中 统一 的 特性 。 
(1) 数据 的 集中 控制 性 


能 够 对 信息 资源 提供 集中 控制 是 使 用 数据 库 进 行 数据 管理 的 最 重要 的 功能 之 一 。 数 据 


户 


而 


区 
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库 是 随 着 信息 系统 的 演变 而 发 展 起 来 的 ,在 这 些 信息 系统 中 ,每 个 应 用 程序 都 有 自己 的 
文件 ,这 样 就 不 利于 数据 的 管理 和 共享 。 由 于 数据 本 身 已 被 当 作 企业 的 重要 资源 ,在 这 样 的 
需求 推动 下 ,传统 的 数据 库 系统 应 运 而 生 。 分 布 式 数 据 库 系统 是 在 传统 数据 库 系统 的 基础 
上 的 发 展 , 所 以 , 它 也 具有 集中 控制 的 特性 。 

在 传统 的 数据 库 系 统 中 ,数据 库 管 理 员 (DBA) 的 基本 任务 是 保证 数据 的 安全 ,并 负责 
对 数据 进行 管理 ,使 用 户 和 应 用 能 够 高 效 地 访问 数据 。 而 在 分 布 式 数 据 库 中 ,存在 全 局 数据 
库 管理 员 和 局 部 数据 库 管理 员 。 这 是 一 种 分 层 控制 结构 ,一般 来 说 ,全 局 数据 库 管 理 员 负责 
管理 所 有 数据 库 , 而 局 部 数据 库 管 理 员 只 负责 各 自 结 点 的 局 部 数据 库 。 但 是 在 有 些 情况 下 ， 
局 部 数据 库 管理 员 可 以 有 更 高 的 自主 性 ,甚至 能 够 完成 结 点 间 的 协调 工作 ,从 而 不 再 需要 全 
局 数据 库 管 理 员 。 

(2) 数据 独立 性 

数据 独立 性 也 是 集中 式 数据 库 相 对 于 文件 系统 的 一 大 特征 。 独 立 性 指 的 是 数据 的 组 成 
对 应 用 程序 来 说 是 透明 的 。 应 用 程序 只 需要 考虑 数据 的 逻辑 结构 ,而 不 用 考虑 数据 的 物理 
存放 ,因而 数据 在 物理 组 织 上 的 改变 不 会 影响 应 用 程序 。 

在 分 布 式 数据 库 系 统 中 ,数据 的 独立 性 同样 具有 重要 意义 。 分 布 式 数据 库 的 数据 独立 
性 除了 具有 传统 意义 上 数据 独立 性 的 含义 之 外 ,还 有 分 布 式 透明 的 含义 。 所 谓 分 布 式 透 明 
是 指 : 虽然 应 用 程序 面 对 的 是 分 散 存 放 的 数据 ,但 就 像 使 用 集中 式 数据 库 一 样 , 不 必 考 虑 数 
据 库 的 分 布 特性 。 

(3) 数据 元 余 可 控 性 

将 数据 组 织 在 数据 库 中 可 以 方便 地 实现 数据 共享 ,因此 要 尽量 减少 数据 宛 余 。 这 不 仅 
能 够 降低 存储 代价 ,还 可 以 提高 查询 效率 ,便于 维护 数据 的 一 致 性 ,这 是 数据 库 系统 优 于 文 
件 系 统 的 特点 之 一 。 但 对 数据 库 系 统 来 说 ,也 不 可 能 做 到 绝对 无 元 余数 据 。 

对 于 分 布 式 数据 库 来 说 ,由 于 数据 存储 的 分 散 性 ,需要 在 网 络 上 传输 数据 。 与 集中 式 数 
据 库 相 比 ,查询 中 就 增加 了 传输 代价 。 因 此 ,分 布 式 数据 库 中 的 数据 一 般 存 储 在 经 常 使 用 的 
场地 上 ,但 应 用 对 两 个 或 两 个 以 上 场地 的 同一 数据 有 存 取 要 求 也 是 时 常 发 生 的 ,而 且 当 传输 
代价 高 于 存储 代价 时 ,可 以 将 同一 数据 存储 在 两 个 (甚至 更 多 ) 场 地 上 ,以 节省 传输 的 开销 。 
另外 ,数据 有 多 个 副本 ,也 可 以 提高 系统 的 可 用 性 , 即 当 系统 中 某 个 结 点 发 生 故 障 时 ,因为 数 
据 有 其 他 副本 在 非 故 障 场地 上 ,数据 仍然 是 可 用 的 ,从 而 保证 了 数据 的 完备 性 。 由 于 这 种 元 
余 度 是 在 系统 控制 下 的 ,因此 给 系统 造成 的 不 利 影响 是 可 控制 的 。 

另外 ,由 于 可 用 副本 的 存在 ,也 相应 地 提高 了 场地 自治 性 的 性 能 。 
(4) 场地 自治 性 
在 分 布 式 数据 库 系统 中 ,多 个 场地 的 局 部 数据 库 逻 辑 上 为 一 个 整体 ,这 个 整体 称 为 全 局 
数据 库 , 并 可 以 为 分 布 式 数据 库 系统 的 所 有 用 户 使 用 ,这 种 应 用 称 为 分 布 式 数 据 库 的 全 局 应 
,其 用 户 为 全 局 用 户 。 同 时 ,分 布 式 数据 库 系统 还 允许 用 户 只 使 用 本 地 的 局 部 数据 库 , 这 
种 应 用 为 局 部 应 用 ,其 用 户 为 局 部 用 户 。 局 部 用 户 所 使 用 的 数据 甚至 可 以 不 参与 到 全 局 数 
据 库 中 去 ,这 种 局 部 应 用 独立 于 全 局 应 用 的 特性 就 是 局 部 数据 库 的 自治 性 。 
由 于 具有 自治 性 ,对 每 个 场地 来 说 就 有 两 种 数据 ,一 种 是 参与 全 局 数据 库 的 局 部 数据 ， 
另 一 种 则 是 不 参与 全 局 数据 库 的 数据 。 
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(5) 存 取 的 有 效 性 

在 传统 的 数据 库 系 统 中 ,采用 二 次 索引 和 文件 链接 等 复杂 的 存储 结构 是 提高 存 取 效率 
的 主要 方法 。 但 在 分 布 式 数据 库 系 统 中 ,仅仅 采用 复杂 的 存 取 结构 并 不 是 正确 的 方法 。 分 
布 式 数据 库 系统 的 全 局 查询 可 以 分 解 成 等 效 的 子 查询 , 即 全 局 查询 的 执行 计划 可 分 解 成 多 
个 子 查询 执行 计划 ( 它 是 根据 系统 的 全 局 优化 策略 产生 的 ) ,而 子 查询 计划 又 是 在 各 场地 上 
分 布 执行 的 。 因 此 ,分 布 式 数据 库 系统 中 的 查询 优化 有 两 个 级 别 : 全 局 优化 和 局 部 优化 。 

全 局 优化 主要 决定 在 多 个 副本 中 选取 合适 的 场地 副本 ,使 得 场地 间 的 数据 传输 量 传输 
次 数 最 少 , 从 而 使 系统 通信 开销 减少 。 而 局 部 优化 就 和 传统 的 集中 式 数据 库 中 的 优化 是 一 
致 的 。 


10.2.3 分 布 式 数 据 库 的 体系 结构 


分 布 式 数据 库 的 模式 结构 是 目前 国内 外 尚 在 讨论 的 问题 ,还 没有 形成 统一 的 标准 ,这 是 
因为 对 分 布 式 数 据 库 系 统 数 据 独 立 性 要 求 的 程度 不 同 ,其 抽象 层次 也 不 同 。 我 国 在 多 年 研 
究 与 开发 分 布 式 数据 库 中 ,制定 了 《分 布 式 数 据 库 系统 标准 》 提 出 把 分 布 式 数据 库 抽 象 为 
4 层 的 模式 结构 ,如 图 10-3 所 示 。 这 一 模式 结构 得 到 了 国内 外 专家 一 定 程度 的 支持 和 
认同 。 
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图 10-3 分 布 式 数据 库 结构 模式 


4 层 模 式 是 指 将 数据 库 系 统 划 分 为 全 局 外 层 、 全 局 概念 层 、 局 部 概念 层 和 局 部 内 层 。 在 
各 层 间 还 有 相应 的 层 间 映射 。4 层 模 式 的 划分 不 仅 适用 于 完全 透明 的 分 布 式 数据 库 系统 ， 
而 且 也 适合 各 种 透明 性 要 求 的 分 布 式 数据 库 系统 。 无 论 是 对 同 构 型 分 布 式 数据 库 系统 ,还 
是 异 构 型 分 布 式 数据 库 系统 都 能 适用 。 


10.2.4 分 布 式 数据 库 系 统 的 分 类 
对 于 分 布 式 数据 库 系统 ,从 不 同 角度 观察 这 些 系统 ,有 不 同 的 分 类 方法 。 例 如 ,可 以 按 
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照 许多 方式 进行 分 类 ,如 可 以 根据 全 局 控制 方式 分 类 ,也 可 以 按 数据 在 逻辑 上 是 集中 /分 布 
来 分 类 ,通常 根据 局 部 场地 的 DBMS 及 数据 模型 来 对 分 布 式 数据 库 系统 进行 分 类 ,可 以 将 
分 布 式 数据 库 系 统 分 为 两 类 : 同 构 分 布 式 数据 库 管理 系统 和 异 构 分 布 式 数据 库 管 理 系统 。 


1. 同 构 分 布 式 数据 库 管 理 系统 


同 构 分 布 式 数据 库 管理 系统 是 指 系统 中 每 个 结 点 上 的 局 部 数据 库 管 理 系 统 (LDBMS) 
类 型 都 相同 , 即 它们 支持 相同 的 数据 类 型 .访问 方法 .优化 策略 .并 发 控制 算法 ,以 及 相同 的 
命令 语言 和 查询 语言 等 。 通 常 同 构 型 各 结 点 的 数据 模型 和 全 局 数据 模型 是 相同 的 。 同 构 分 
布 式 数据 库 管理 系统 类 似 于 一 个 集中 式 数据 库 , 只 不 过 同 构 分 布 式 数据 库 将 数据 存放 分 布 
在 网 络 中 不 同 的 结 点 内 ,而 不 是 存放 在 一 个 结 点 内 。 同 构 分 布 式 数据 库 系统 可 以 根据 是 否 
自治 划分 为 自治 式 分 布 式 数据 库 系统 和 非 自治 式 分 布 式 数据 库 系统 。 


2. 异 构 分 布 式 数据 库 管理 系统 


异 构 分 布 式 数据 库 系 统 是 指 系 统 中 每 个 结 点 上 可 以 有 不 同类 型 的 LDBM, 它 的 特点 是 
在 各 结 点 上 运行 着 不 同 的 数据 库 管理 系统 。 它 们 可 以 是 层次 、 网 状 和 关系 型 的 数据 库 管理 
系统 ,也 可 以 是 同一 数据 模型 但 不 同 厂商 提供 的 DBMS 产品 。 因 此 ,在 异 构 分 布 式 数据 库 
系统 中 ,应 该 提出 对 不 同 数据 模型 访问 方法 \、 优 化 策略 、 并 发 控制 算法 以 及 查询 语言 的 支 
持 。 在 异 构 分 布 式 数据 库 系 统 中 ,不 同 结 点 上 的 数据 库 系 统 具 有 独立 性 、 自 治 性 和 分 布 透明 
性 等 特点 ,用 户 对 任何 数据 库 的 操作 不 必 关 心 其 数据 模型 .物理 位 置 等 细节 ,如 同 在 本 地 执 
行 一 样 。 因 此 , 它 屏 蔽 了 各 种 数据 库 在 物理 上 和 人 逻辑 上 的 差异 ,使 用 户 用 自己 所 熟悉 的 一 种 
数据 操作 语言 就 能 够 操纵 任何 一 种 数据 库 。 

异 构 分 布 式 数据 库 管理 系统 在 数据 库 设 计 和 实现 比 同 构 型 系统 复杂 。 它 要 解决 不 同 的 
DBMS 之 间 的 数据 模型 .事务 管理 协议 、 查 询 语言 等 的 转换 问题 。 这 种 转换 通常 需要 寻找 
某 种 合适 的 公共 数据 模型 , 常 选用 一 种 称 做 规范 的 中 间 数 据 模型 和 中 间 语 言 。 然 后 将 不 同 
类 型 的 DBMS 数据 模型 和 查询 语言 先 转换 成 中 间 规 范 的 形式 ,再 完成 它们 之 间 的 转换 。 通 
常 不 建议 采用 各 结 点 之 间 一 对 一 的 转换 方式 ,以 减少 转换 次 数 。 


(i0,3 Web 与 数据 库 


随 着 网 络 的 高 速 发 展 和 网 络 服务 的 日 趋 完 善 , 网 络 上 信息 量 呈 几何 级 数 增长 。 为 了 有 
效 地 组 织 、 存 储 、 管 理 和 使 用 网 上 的 信息 ,数据 库 技术 被 普遍 地 应 用 于 网 络 领 域 。 人 们 在 
Internet 上 建立 了 数 以 万 计 的 网 站 ,尤其 是 大 中 型 网 站 的 后 台 都 有 数据 库 系统 的 支持 。 数 
据 库 系 统 可 以 将 网 站 的 各 种 数据 很 好 地 组 织 起 来 .并 自动 生成 Web 页 面 。 


10.3.1 Web 数据 库 


数据 库 技术 是 计算 机 处 理 与 存储 数据 最 有 效 、 最 成 功 的 技术 ,而 计算 机 网 络 的 特点 是 资 
源 共享 ,因此 数据 与 资源 共享 这 两 种 技术 的 结合 即 成 为 今天 广泛 应 用 的 Web 数据 库 ( 也 叫 
网 络 数据 库 ) 。 
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Web 的 产生 与 互联 网 的 发 展 是 密切 相关 的 。 互 联网 是 由 全 球 众多 的 计算 机 局 域 网 互 
相连 接 组 成 的 一 个 超大 规模 的 网 络 系统 。 在 这 个 系统 中 运行 着 多 种 应 用 系统 ,如 上 网 使 
的 网 页 浏览 系统 WWW、 上 传 与 下 载 用 的 文件 传输 系统 FTP, 以 及 收发 电子 邮件 所 使 用 的 
电子 邮件 系统 E-mail 等 。 互 联网 中 运行 的 每 一 种 应 用 系统 都 是 由 互联 网 中 相应 的 服务 器 
系统 和 客户 机 系统 构成 的 ,也 就 是 说 ,从 物理 连接 来 看 ,互联 网 是 由 众多 的 计算 机 组 成 的 ,而 
从 逻辑 上 看 ,互联 网 是 由 多 个 功能 子 网 组 成 的 。 

在 浏览 网 页 时 ,服务 器 上 的 WWW 服务 允许 单 击 “ 超 级 链接 ”, 每 单 击 一 项 ,WWW 程序 
就 会 执行 所 要 求 的 任务 ,一 直到 需要 得 到 满足 为 止 。 在 这 一 过 程 中 ,涉及 两 个 不 同 的 程序 。 
一 个 程序 安装 在 客户 机 上 ,处 理 鼠 标 单 击 事件 ,发 出 http 请 求 。 接 到 响应 后 ,立即 显示 链接 
的 网 页 内 容 , 这 个 程序 叫做 WWW 客户 机 程序 ,如 上 网 使 用 的 浏览 器 (IE 或 Netscape) 。 另 
一 个 程序 在 服务 器 上 ,如 Internet 信息 服务 (Internet Information Server, JIS) 或 阿 帕 奇 
(Apache) Web 服务 器 软件 , 它 对 WWW 客户 机 的 请 求 进行 处 理 并 返回 处 理 结果 , 即 在 接 到 
http 请 求 后 做 出 响应 。 

Web 数据 库 就 是 利用 浏览 器 作为 用 户 输入 接口 ,输入 所 需要 的 数据 ,浏览 器 将 这 些 数 
据 传送 给 网 站 。 网 站 再 对 这 些 数据 进行 处 理 , 例 如 将 数据 存 入 后 台数 据 库 或 者 对 后 台数 据 
库 进 行 查询 操作 等 。 最 后 ,网 站 将 操作 结果 回 传 给 浏览 器 ,通过 浏览 器 将 结果 告知 用 户 。 网 
站 上 的 后 台数 据 库 就 是 Web 数据 库 。 

总 之 ,数据 库 技术 用 于 对 大 量 的 数据 进行 组 织 和 管理 ; Web 技术 具有 较 佳 的 信息 发 布 
途径 ,这 两 种 技术 的 天 然 互补 性 决定 了 相互 融合 是 其 发 展 的 必然 趋势 。 将 Web 技术 与 数据 
库 技术 融合 在 一 起 ,使 数据 库 系统 成 为 Web 的 重要 有 机 组 成 部 分 ,不 仅 可 以 把 二 者 的 所 有 
优点 集中 在 一 起 ,而 且 能 够 充分 利用 大 量 已 有 的 数据 库 信息 资源 ,使 用 户 在 Web 浏览 器 上 
方便 地 检索 和 浏览 数据 库 的 内 容 , 这 对 许多 软件 开发 者 来 说 具有 极 大 的 吸引 力 。 因 此 ,将 
Web 技术 与 数据 库 相 结合 ,开发 动态 的 Web 数据 库 应 用 已 成 为 当今 Web 技术 研究 的 热点 。 
数据 库 厂家 也 推出 了 各 自 的 产品 和 中 间 件 以 支持 Web 技术 和 DBMS 的 融合 ,使 两 者 能 够 
互相 取长补短 ,发 挥 各 自 的 优势 。Web 数据 库 技术 是 Web 技术 与 数据 库 技术 相互 结合 的 
产物 , 它 的 出 现 将 信息 的 存储 ,管理 和 检索 提升 到 了 一 个 全 新 的 高 度 。 在 目前 Web 数据 库 
应 用 的 开发 领域 中 ,有 多 种 用 于 开发 Web 数据 库 系统 的 技术 ,如 CGI、PHP、ASP、ASP. 
NET Java EE 等 。 


10.3.2 Web 数据库 与 传统 数据 库 比 较 


Web 数据 库 技术 是 Web 技术 与 数据 库 技术 相互 结合 的 产物 ,是 人 们 对 信息 的 需求 日 
益 高 涨 的 必然 结果 。Web 数据 库 与 传统 的 关系 数据 库 相 比 ,具有 以 下 的 优点 。 
(1) 界面 统一 。Web 数据 库 借 用 现成 的 浏览 器 软件 ,无 须 再 开发 数据 库 前 端 。 如 果 能 
够 通过 WWW 来 访问 数据 库 , 我 们 就 不 需要 开发 客户 端 程序 ,使 用 的 数据 库 应 用 都 可 以 通 
过 浏览 器 来 实现 。 这 样 一 来 ,不 但 客户 端 界 面 统 一 .同时 也 减少 了 培训 的 时 间 和 费用 ,能 使 
广大 用 户 很 方便 地 访问 数据 库 信息 。 

(2) 标准 统一 。Web 数据 库 开发 过 程 简单 .标准 相对 统一 。HTML 是 一 种 国际 标准 ， 
Internet 中 所 有 的 Web 服务 器 与 客户 端 浏 览 器 都 支持 这 一 标准 ,开发 者 甚至 只 需 学 习 
HTML 一 种 语言 ,使 用 者 只 需 通 过 浏览 器 界面 就 可 以 方便 地 检索 和 浏览 数据 库 的 内 容 。 
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(3) 交叉 平台 支持 。 几 乎 在 各 种 操作 系统 上 都 有 现成 的 浏览 器 可 供 使 用 ,为 一 个 Web 
服务 器 书写 的 HTML 文档 ,可 以 被 几乎 所 有 平台 的 浏览 器 所 浏览 ,实现 了 跨 平台 操作 。 
因此 ,Web 数据 库 应 用 的 普遍 化 是 当今 数据 库 应 用 发 展 的 一 个 必然 趋势 。 


10.3.3 Web 服务 器 脚本 程序 与 服务 器 的 接口 


Web 页 面 与 数据 库 的 连接 是 Web 数据 库 的 基本 要 求 。 目 前 ,基于 Web 数据 库 的 连接 
方案 主要 有 两 种 类 型 : 服务 器 端 和 客户 端 方案 。 服 务 器 端 方案 的 实现 技术 有 CGI、PHP、 
ASP、ASP. NET ,Java EE 等 。 客 户 端 方案 的 实现 技术 有 JDBC 等 。 

通常 Web 数据 库 的 环境 由 硬件 元 素 和 软件 元 素 组 成 。 硬 件 元 素 包 括 Web 服务 器 、 客 
户 机 数据库 服 务 器 和 网 络 ; 软件 元 素 包括 客户 端 和 服务 器 端 两 个 方面 。 客 户 端 必须 有 能 
够 解释 执行 HTML 代码 的 浏览 器 (如 IE 和 Netscape 等 )。 在 Web 服务 器 中 ,必须 具有 能 
自动 生成 HTML 代码 程序 的 功能 ,如 ASP 和 CGI 等 ,具有 能 自动 完成 数据 操作 指令 的 数 
据 库 系统 ,如 Access 和 SQL Server 等 。 

Web 服务 器 使 用 HTTP 协议 对 客户 机 的 请 求 给 予 回答 。 每 个 Web 服务 器 在 Internet 

上 都 有 一 个 唯一 的 地 址 ,这 个 地 址 可 以 是 一 个 域名 ,也 可 以 是 4 个 以 点 分 隔 的 0 一 255 之 间 
的 数字 ,例如 www. yahoo. com 或 202. 106. 168. 67。 如 果 客 户 机 提出 一 个 合法 的 请 求 , 那 
么 Web 服务 器 就 会 把 请 求 的 内 容 传送 给 客户 机 。Web 服务 器 不 仅 能 够 传送 各 种 文件 ,还 
可 以 传送 某 个 程序 的 输出 结果 ,这 为 Web 和 数据 库 的 结合 创造 了 条 件 。Web 服务 器 的 种 
类 很 多 ,比较 著名 的 有 IIS 和 Apache 等 。 

典型 的 Web 和 数据 库 的 运行 模式 如 图 10-4 所 示 。 


A 
| 
| 数据 库 | 
| 
上 1 
! 数据 库 管 理 系统 | 
| 有 a 
Web 妥 0 本 
| Web 服 务 器 | 
1 
Le 下 
[客户 端 本 
| Internet 客 户 机 Internet 客 户 机 Jnternet 客 户 机 | 
[| a 


图 10-4 Web 和 数据 库 运 行 模式 示意 图 


在 脚本 程序 中 一 般 都 需要 采用 相应 的 接口 连接 数据 库 。 连 接 数 据 库 的 常用 方法 有 
ODBC、DAO、RDO 及 ADO 等 。 


1. ODBC 


ODBC(Open Database Connectivity, 开 放 式 数据 库 连 接 ) 是 微软 开发 的 一 套 统一 的 程 
序 接口 。 它 建立 了 一 组 规范 ,并 提供 了 一 组 对 数据 库 访问 的 标准 API( 应 用 程序 编程 接口 ) 。 
这 些 API 利用 SQL 来 完成 其 大 部 分 任务 。ODBC 本 身 也 提供 了 对 SQL 语言 的 支持 ,用 户 


第 10 章 “数据库 技术 的 新 发 展 


可 以 直接 将 SQL 语句 送 给 ODBC。 经 过 多 年 的 改进 , 它 已 成 为 存 取 数据 库 服 务 器 的 标准 。 
事实 上 ,ODBC 技术 已 成 为 后 来 的 DAO、RDO 及 ADO 等 数据 库 访问 技术 的 基础 。 


2. DAO 


DAO(Data Access Objects, 数 据 访 问 对 象 ) 是 微软 公司 开发 的 一 种 应 用 程序 编程 接口 
(APD ,是 微软 的 第 一 个 面向 对 象 的 数据 库 接口 。 利 用 它 可 以 访问 数据 库 的 标准 对 象 ,如 
Access、VB、Excel 和 Word 等 。DAO 最 适用 于 单 系统 应 用 程序 或 小 范围 本 地 分 布 使 用 。 


3. RDO 


RDO(Remote Data Objects ,远程 数据 对 象 ) 是 微软 公司 为 增强 DAO 的 功能 而 推出 的 
新 产品 。 该 产品 强化 了 SQL Server 的 访问 功能 ,提高 了 SQL Server 的 执行 效率 。RDO 已 
被 证 明 是 许多 SQL Server、Oracle 以 及 其 他 大 型 关系 数据 库 开 发 者 经 常 选 用 的 接口 。RDO 
提供 了 用 来 访问 存储 过 程 和 复杂 结果 集 的 更 多 和 更 复杂 的 对 象 . 属 性 ,以 及 方法 。 


4. ADO 


ADO(CActiveX Data Objects, ActiveX 数据 对 象 ) 是 微软 在 Internet 领域 采取 的 新 举 
措 。 它 本 身 并 不 是 一 项 新 技术 ,从 对 象 结构 的 角度 来 看 , 它 比 DAO 提供 的 对 象 更 少 ; 从 存 
取 SQL 服务 器 的 角度 来 看 , 它 提 供 的 功能 也 不 如 RDO。 但 它 汲取 了 DAO 和 RDO 精华 的 
部 分 ,成 为 一 个 更 适合 于 Internet 的 小 而 精 的 对 象 群 。 因 此 ,ADO 实际 上 是 脚本 程序 连接 
数据 库 的 一 种 最 佳 选择 。 在 新 的 编程 框架 . NET Framework 中 , 微软 也 提供 了 一 个 面向 
Internet 的 版 本 的 ADO , 称 为 ADO.NET, 其 对 象 模型 和 传统 ADO 差别 很 大 。 


10.3.4 应 用 开发 平台 


由 于 Web 应 用 开发 的 独特 性 ,应 用 开发 平台 成 为 众多 厂商 关注 的 焦点 。 目 前 市 场 上 存 
在 很 多 Web 应 用 标准 和 集成 开发 环境 ,下 面 介绍 目前 比较 流行 的 三 种 。 


1. ASP.NET 


ASP(ActiveX Server Pages) 是 由 微软 创建 的 Web 应 用 开发 标准 ,是 一 种 使 嵌入 网 页 中 的 
脚本 可 由 因特网 服务 器 执行 的 服务 器 端 脚本 技术 。 它 是 ASP. NET 的 前 身 。ASP. NET 是 建 
立 在 微软 新 一 代 . NET 平台 构 上 ,利用 普通 语言 运行 时 (CLR ) 在 服务 器 后 端 为 用 户 提供 建 
立 强大 的 企业 级 Web 应 用 服务 的 编程 框架 。ASP. NET 是 一 个 已 编译 的 、 基 于. NET 的 环 
境 , 把 基于 通用 语言 的 程序 在 服务 器 上 运行 。 将 程序 在 服务 器 端 首次 运行 时 进行 编译 , 比 
ASP 即时 解释 程序 的 速度 要 快 很 多 。 而 且 是 可 以 用 任何 与 . NET 兼容 的 语言 (包括 VB. 
NET、C# 和 JScript .NET) 创 作 应 用 程序 。ASP. NET 可 完全 利用 . NET 架构 的 强大 、 安 
全 和 高 效 的 平台 特性 ,运行 时 早 绑 定 .即时 编译 本 地 优化 、 缓 存 服务 . 零 安 装配 置 和 基于 和 运 
行 时 代码 受 管 与 验证 的 安全 机 制 等 都 为 ASP. NET 带 来 了 卓越 的 性 能 。 


2 PR 


PHP 是 一 种 HTML 内 赃 式 的 语言 ,是 一 种 在 服务 器 端 执 行 的 嵌入 HTML 文档 的 脚 
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本 语言 。 PHP 由 于 具有 良好 的 性 能 及 开源 的 特点 ,成 为 目前 互联 网 中 应 用 非常 流行 的 一 种 
应 用 开发 平台 。PHP 具有 非常 强大 的 功能 ,所 有 的 CGI 的 功能 PHP 都 能 实现 ,而 且 支持 
几乎 所 有 流行 的 数据 库 以 及 操作 系统 。 它 具有 很 多 方面 的 优点 : 首先 和 其 他 技术 相 比 ， 
PHP 本 身 免费 ,是 开放 的 源 代码 ,其 次 PHP 简单 易学 ,程序 开发 快 ,运行 快 ,技术 本 身 容易 
学 习 。 因 为 PHP 可 以 嵌入 HTML 语言 , 它 相 对 于 其 他 语言 ,编辑 简单 ,实用 性 强 ,更 适合 
初学 者 。 此 外 ,PHP 还 可 以 跨 平台 互 用 ,是 具有 良好 数据 库 交换 能 力 的 开发 语言 ,能 够 与 
Apache 及 其 扩展 库 紧 密 结合 ,具有 良好 的 安全 性 ; PHP 消耗 相当 少 的 系统 资源 ,效率 高 。 
PHP 不 足 之 处 在 于 安装 配置 复杂 ,缺少 企业 级 的 支持 ,作为 自由 软件 ,缺乏 正规 的 商业 支 
持 , 无 法 实现 商品 化 的 商业 开发 。 


3. Java EE 


Java EE(Java Platform,Enterprise Edition) 是 Sun 公司 推出 的 企业 级 应 用 程序 版 本 。 
这 个 版 本 以 前 称 为 ]2EE。 能 够 帮助 我 们 开发 和 部 署 可 移植 .健壮 .可 伸缩 且 安 全 的 服务 器 
端 Java 应 用 程序 。 简 单 地 说 ,Java EE 就 是 一 套 API 的 规范 ,一 个 分 布 式 计算 体系 ,以 及 
于 分 布 式 部 署 的 组 件 包 的 定义 。 它 是 标准 化 组 件 、 容 器 、 服 务 的 集合 ,用 于 在 一 个 明确 的 分 
布 式 计算 系统 中 创建 和 部 署 分 布 式 应 用 。Java EE 平台 由 一 整套 服务 (Service) ,应 用 程序 
接口 (API) 和 相关 协议 构成 。 它 对 开发 基于 Web 的 多 层 、 分 布 式 应 用 提供 了 强大 的 功能 支 
持 。 通 常 ,Java EE 的 目标 是 大 规模 的 业务 系统 。 所 以 这 个 级 别 的 软件 不 会 运行 在 单机 上 。 
因此 需要 把 一 个 软件 分 割 成 许多 功能 模块 ,并 部 署 到 相应 的 计算 机 硬件 平台 上 。 这 也 就 是 
分 布 式 计算 的 本 质 。Java EE 还 包含 了 一 套 实 现 软 件 部 署 的 标准 化 组 件 , 定 义 了 各 种 软件 
模块 如 何 交互 的 标准 接口 ,以 及 不 同 软件 模块 通信 的 标准 服务 。 


(i0,4 数据 仓库 


信息 技术 的 广泛 应 用 将 企业 带 入 了 信息 爆炸 的 时 代 , 管 理 者 面 对 着 大 量 等 待 处 理 的 信 
息 。 对 这 些 信息 的 处 理 分 为 事务 型 处 理 和 信息 型 处 理 两 大 类 。 事 务 型 处 理 就 是 通常 所 说 的 
业务 操作 处 理 , 是 对 管理 信息 进行 的 日 常 操作 。 对 信息 进行 查询 和 修改 ,目的 是 为 了 满足 组 织 
特定 的 日 常 管理 需要 。 信 息 型 处 理 则 是 对 信息 做 进一步 的 分 析 , 为 管理 人 员 决策 提 供 支持 。 
这 类 信息 的 处 理 在 现代 企业 中 应 用 越 来 越 广泛 , 越 来 越 引起 管理 人 员 的 重视 。 管 理 信息 的 信 
息 型 处 理 必须 访问 大 量 的 历史 数据 才能 完成 ,不 像 事务 型 处 理 那 样 ,只 对 当前 信息 感 兴趣 。 


10.4.1 数据 仓库 概述 
1. 数据 仓库 的 定义 


数据 仓库 (Data Warehouse.DW) 的 概念 是 20 世纪 90 年 代 初 被 提出 来 的 。 传 统 数据 库 
在 联机 事务 处 理 (Online Transaction Processing,OLTP) 中 获得 了 较 大 的 成 功 ,但 对 管理 人 
员 的 决策 分 析 要 求 却 无 法 满足 。 因 为 管理 人 员 和 希望 对 组 织 中 的 大 量 数据 进行 分 析 , 了 解 组 
织 业务 的 发 展 趋势 。 而 传统 的 数据 库 中 只 能 保留 当前 的 管理 信息 ,缺乏 决策 分 析 所 需要 的 
大 量 历史 信息 。 为 了 满足 管理 人 员 决 策 分 析 的 需要 ,在 数据 库 基 础 上 产生 了 能 满足 决策 分 
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析 需 要 的 数据 环境 一 一 数据 仓库 。 

数据 仓库 是 决策 支持 系统 和 联机 分 析 应 用 数据 源 的 结构 化 数据 环境 。 数 据 仓 库 研究 和 
解决 从 数据 库 中 获取 信息 的 问题 。 数 据 仓 库 之 父 William H.Inmon 于 1991 年 出 版 的 
Building the Data Warehouse 一 书 对 数据 仓库 给 出 了 如 下 定义 : 数据 仓库 是 一 个 面向 主题 
的 、 集 成 的 .相对 稳定 的 反映 历史 变化 的 数据 集合 ,用 于 支持 经 营 管理 中 的 决策 制定 过 程 。 


2. 数据 仓库 与 数据 库 


数据 仓库 虽然 是 从 数据 库 发 展 而 来 的 ,但 是 二 者 在 许多 方面 有 很 大 的 差异 ,如 表 10-1 
所 示 。 从 表 中 可 以 看 出 ,数据 库 是 面向 事务 的 设计 ,数据 仓库 是 面向 主题 设计 的 。 数 据 库 一 
般 存 储 数据 的 当前 值 ,而 数据 仓库 存储 的 一 般 是 历史 数据 。 数 据 库 中 的 数据 是 动态 变化 的 ， 
而 数据 仓库 中 的 数据 是 静态 的 ,不 能 直接 更 新 。 数 据 库 中 数据 结构 是 高 度 结构 化 复杂 、 适 
合 操作 计算 的 ,而 数据 仓库 中 的 数据 结构 相对 比较 简单 ,适合 分 析 。 另 外 ,数据 库 设计 时 尽 
量 避 免 宛 余 , 一 般 采 用 符合 范式 的 规则 来 设计 ,而 数据 仓库 在 设计 时 有 意 引入 宛 余 , 采 用 反 
范式 的 方式 来 设计 。 数 据 库 在 基本 容量 上 要 比 数据 仓库 小 得 多 。 数 据 库 是 为 了 高 效 的 事务 
处 理 而 设计 的 ,服务 对 象 为 企业 业务 处 理 方面 的 工作 人 员 ,而 数据 仓库 是 为 了 分 析 数 据 进行 
决策 而 设计 的 ,服务 对 象 为 企业 高 层 决策 人 员 。 


表 10-1 数据 仓库 与 数据 库 的 比较 


内 容 数据 仓库 数 据 库 
数据 内 容 历史 的 ,存档 的 ,归纳 的 ,计算 的 当前 值 
数据 目标 面向 主题 域 . 分 析 应 用 面向 业务 操作 人 员 ,重复 处 理 
数据 特性 静态 ,不 能 直接 更 新 ,只 能 定时 添加 、 刷 新 动态 变化 , 按 字段 更 新 
数据 结构 简单 .适合 分 析 高 度 结构 化 .复杂 适合 操作 计算 
使 用 频率 中 、 低 高 
数据 访问 量 有 的 事务 可 能 需要 访问 大 量 记录 每 个 事务 只 访问 少量 的 记录 
对 响应 时 间 的 要 求 ” 以 秒 , 分 钟 . 甚 至 小 时 为 计算 单位 以 秒 为 单位 计算 


10.4.2 数据 仓库 的 基本 特性 


数据 仓库 具有 以 下 四 个 基本 的 特性 : 数据 是 面向 主题 的 .数据 是 集成 的 .数据 是 相对 稳 
定 的 数据 是 反映 历史 变化 的 。 


1. 数据 是 面向 主题 的 


数据 仓库 中 的 数据 是 按 面 向 主题 进行 组 织 的 。 从 信息 管理 的 角度 来 看 ,主题 就 是 一 个 
较 高 的 管理 层次 上 对 信息 系统 中 的 数据 按照 某 一 具体 的 管理 对 象 进 行 综合 、 归 类 所 形成 的 
分 析 对 象 。 从 数据 组 织 的 角度 来 看 ,主题 就 是 一 些 数 据 集 合 , 这 些 数据 集合 对 分 析 对 象 进行 
了 比较 完整 的 ,一 致 的 数据 描述 ,这 种 数据 描述 不 仅 涉及 数据 自身 ,还 涉及 数据 间 的 联系 。 
例如 ,企业 中 的 客户 、 产 品 和 供应 商 等 都 可 以 作为 主题 来 看 待 。 

数据 仓库 的 创建 和 使 用 都 是 围绕 主题 实现 的 ,因此 .必须 了 解 如 何 按照 决策 分 析 来 抽取 
主题 ,所 抽取 的 主题 应 该 包含 哪些 数据 内 容 , 这 些 数据 应 该 如 何 组 织 。 在 进行 主题 抽取 时 ， 
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必须 按照 决策 分 析 对 象 进行 。 例 如 ,企业 销售 管理 人 员 所 关心 的 是 本 企业 哪些 产品 销售 量 
大 、 利 润 高 ? 哪些 客户 采购 的 产品 数量 多 ? 竞争 对 手 的 哪些 产品 对 本 企业 的 产品 构成 威胁 ? 
根据 这 些 管理 决策 分 析 对 象 ,就 可 以 抽取 “产品 ”和 "客户 ”等 主题 。 


2. 数据 是 集成 的 


数据 仓库 的 集成 性 是 指 根据 决策 分 析 的 要 求 , 对 分 散 于 各 处 的 源 数据 进行 抽取 、 筛 选 、 
清理 及 综合 等 集成 工作 ,使 数据 仓库 中 的 数据 具有 集成 性 。 

数据 仓库 所 需要 的 数据 不 像 业 务 处 理 系 统 那 样 直接 从 业务 发 生地 获取 数据 。 例 如 , 联 
机 事务 处 理 系统 OLTP .企业 业 务 流程 重组 BPR 以 及 基于 因特网 的 电子 商务 中 的 数据 是 与 
业务 处 理 联系 在 一 起 的 ,只 为 业务 的 日 常 处 理 服务 ,而 不 是 为 决策 分 析 服 务 。 这 样 ,数据 仓 
库 在 从 业务 处 理 系 统 那 里 获取 数据 时 ,并 不 能 将 原 数 据 库 中 的 数据 直接 加 载 到 数据 仓库 中 ， 
而 要 进行 一 系列 的 数据 预 处 理 。 也 就 是 说 ,从 原 数 据 库 中 挑选 出 数据 仓库 所 需要 的 数据 , 然 
后 将 来 自 不 同 数据 库 中 的 数据 按 某 一 标准 进行 统一 ,如 将 数据 源 中 数据 的 单位 、 字 长 与 内 容 
统一 起 来 ,将 源 数据 中 字段 的 同名 异 义 、 异 义 同名 现象 消除 ,然后 将 源 数 据 加 载 到 数据 仓库 ， 
并 对 数据 仓库 中 的 数据 进行 某 种 程度 的 综合 ,进行 概括 和 聚集 处 理 。 


3. 数据 是 相对 稳定 的 


数据 仓库 的 数据 主要 供 决 策 分 析 用 ,所 涉及 的 数据 操作 主要 是 数据 查询 ,一 般 情况 下 并 
不 进行 修改 操作 。 数 据 仓库 的 数据 反映 的 是 一 段 相 当 长 的 时 间 内 历史 数据 的 内 容 , 是 不 同 
时 间 的 数据 库 快照 的 集合 ,以 及 基于 这 些 快照 进行 统计 ,综合 和 重组 的 导出 数据 ,而 不 是 联 
机 处 理 的 数据 。 数 据 库 中 进行 联机 处 理 的 数据 经 过 集成 输入 到 数据 仓库 中 。 因 为 数据 仓库 
只 进行 数据 查询 操作 ,DBMS 中 的 完整 性 保护 、 并 发 控制 ,在 数据 仓库 管理 中 都 可 以 省 去 。 
但 是 ,由 于 数据 仓库 的 查询 数据 量 往往 很 大 ,所 以 对 数据 查询 提出 了 更 高 的 要 求 ,需要 采用 
复杂 的 索引 技术 。 

4. 数据 是 反映 历史 变化 的 


数据 仓库 中 数据 的 相对 稳定 是 针对 应 用 而 言 的 ,数据 仓库 的 用 户 进行 分 析 处 理 时 是 不 
进行 数据 更 新 操作 的 ,但 并 不 表明 在 从 数据 集成 输入 数据 仓库 开始 到 最 终 被 删除 的 整个 数 
据 生 存 周 期 中 ,数据 仓库 中 所 有 的 数据 是 永远 不 变 的 。 数 据 仓 库 中 的 数据 是 反映 历史 变化 
的 ,这 主要 表现 在 如 下 3 个 方面 : 

(1) 数据 仓库 随时 间 变 化 不 断 增加 新 的 数据 内 容 。 数 据 仓 库 系统 必须 不 断 捕 担 OLTP 
数据 库 中 变化 的 数据 ,追加 到 数据 仓库 中 去 。 

(2) 数据 仓库 随时 间 变 化 不 断 删 除 旧 的 数据 内 容 。 

(3) 数据 仓库 中 包含 大 量 的 综合 数据 ,这 些 数据 有 很 多 信息 与 时 间 有 关 , 如 数据 经 常 按 
时 间 段 进行 综合 ,或 隔 一 定 的 时 间 进 行 抽样 等 ,这 些 数据 要 随时 间 不 断 地 进行 重新 综合 。 


10.4.3 数据 仓库 的 体系 结构 


数据 仓库 通常 采用 3 层 体系 结构 ,底层 为 数据 仓库 服务 器 ,中 间 层 为 OLAP 服务 器 ,项 
层 为 前 端 工具 。 底 层 的 数据 仓库 服务 器 一 般 是 一 个 关系 数据 库 系统 ,数据 仓库 服务 器 从 操 
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作 型 数据 库 或 外 部 数据 源 提取 数据 ,对 数据 进行 清理 ,转换 和 集成 等 ,然后 装 入 数据 仓库 中 。 
中 间 层 的 OLAP 服务 器 的 实现 可 以 是 关系 型 OLAP, 即 扩充 的 关系 型 DBMS, 提供 对 多 维 
数据 的 支持 ,也 可 以 是 多 维 的 OLAP 服务 器 , 它 是 一 种 特殊 的 服务 器 ,直接 支持 多 维 数据 的 
存储 和 操作 。 顶 层 的 前 端 工具 主要 包括 各 种 查询 工具 和 报表 工具 、 数 据 分 析 工 具 及 数据 挖 
掘 工 具 等 。 其 中 数据 分 析 工具 主要 针对 OLAP 服务 器 ,报表 工具 、 数 据 挖掘 工具 主要 针对 
数据 仓库 。 

从 结构 的 角度 看 ,可 有 3 种 数据 仓库 模型 : 企业 仓库 .数据 集 市 和 虚拟 仓库 。 

企业 仓库 收集 跨越 整个 企业 各 个 主题 的 所 有 信息 。 它 提供 全 企业 范围 的 数据 集成 , 数 
据 通常 都 来 自 多 个 操作 型 数据 库 和 外 部 信息 提供 者 ,并 且 是 跨越 多 个 功能 范围 的 。 它 通常 
包含 详细 数据 和 汇总 数据 。 企 业 数据 仓库 可 以 在 传统 的 大 型 机 上 实现 ,如 UNIX 超级 服务 
器 或 并 行 结构 平台 。 它 需要 广泛 的 业务 建 模 , 可 能 需要 多 年 的 时 间 来 设计 和 建造 。 

数据 集 市 包含 对 特定 用 户 有 用 的 、 企 业 范 围 数 据 的 一 个 子 集 。 它 的 范围 限于 选 定 的 主 
题 。 例 如 一 个 商场 的 数据 集 市 可 能 限定 它 的 主题 为 顾客 .商品 和 销售 。 包 括 在 数据 集 市 中 
的 数据 通常 是 汇总 的 。 通 常 ,数据 集 市 可 以 在 低 价格 的 部 门 服务 器 上 实现 ,基于 UNIX 或 
Windows NT/2000/XP。 实 现 数据 集 市 的 周期 一 般 是 数 周 , 而 不 是 数 月 或 数 年 。 但 是 ,如 
果 它 的 规划 不 是 企业 范围 的 ,从 长 远 角度 讲 , 可 能 会 涉及 很 复杂 的 集成 问题 。 根 据 数据 的 来 
源 不 同 ,数据 集 市 分 为 独立 的 和 依赖 的 两 类 。 在 独立 的 数据 集 市 中 ,数据 来 自 一 个 或 多 个 操 
作 型 数据 库 或 外 部 信息 提供 者 ,或 者 是 一 个 特定 部 门 或 本 地 产生 的 数据 。 在 依赖 数据 集 市 
中 ,数据 直接 来 自 企 业 数据 仓库 。 

虚拟 仓库 是 操作 型 数据 库 上 视图 的 集合 。 为 了 有 效 地 处 理 查询 ,只 有 一 些 可 能 的 汇总 
视图 被 物化 。 虚 拟 仓库 易于 建立 ,但 需要 操作 型 数据 库 服务 器 具有 剩余 能 力 。 


10.4.4 数据 仓库 设计 


数据 仓库 的 开发 过 程 一 般 包 括 数据 仓库 的 分 析 ,数据 仓库 的 设计 ` 数 据 仓库 的 实施 和 数 
据 仓库 的 应 用 、 支 持 和 增强 等 四 个 阶段 。 进 行 数据 仓库 的 设计 时 ,采用 与 传统 数据 库 一 样 的 
设计 方式 。 构 建 数据 仓库 通常 进行 三 个 层次 的 数据 模型 设计 : 概念 模型 .逻辑 模型 和 物理 
模型 。 

数据 仓库 概念 模型 的 设计 一 般 包括 界定 系统 边界 ; 确定 数据 分 析 的 主题 ; 确定 量度 和 
数据 粒度 ; 确定 数据 分 析 维 度 ; 定义 类 别 ; 创建 信息 包 图 。 概 念 模型 的 设计 是 在 较 高 的 抽 
象 层 次 上 的 设计 ,因此 建立 概念 模型 时 不 用 考虑 具体 技术 条 件 的 限制 。 

根据 数据 仓库 的 概念 模型 并 不 能 直接 建立 数据 仓库 的 物理 模型 ,它们 之 间 还 存在 一 个 
中 间 层 的 逻辑 模型 。 由 人 逻辑 模型 来 指导 数据 仓库 的 物理 实施 。 设 计数 据 仓库 的 逻辑 模型 的 
主要 任务 是 对 前 期 收集 的 信息 的 细 化 ,将 信息 包 图 转换 成 数据 仓库 的 模型 图 。 

数据 仓库 逻辑 模型 的 设计 主要 包括 粒度 层次 划分 ,数据 分 割 策略 的 确定 ,关系 模式 的 定 
义 ,数据 源 及 数据 抽取 模型 的 确定 等 。 数 据 仓 库 逻 辑 设计 中 要 解决 的 一 个 重要 问题 是 决定 
数据 仓库 的 粒度 划分 层次 ,粒度 层次 划分 适当 与 否 直 接 影响 到 数据 仓库 中 的 数据 量 和 所 适 
合 的 查询 类 型 。 在 确定 数据 分 割 策 略 时 ,要 选择 适当 的 数据 分 割 的 标准 。 一 般 要 考虑 以 下 
几 方 面 的 因素 :数据 量 、 数 据 分 析 处 理 的 实际 情况 、 简 单 易 行 以 及 粒度 划分 策略 等 。 数 据 量 
的 大 小 是 决定 是 否 进 行 数据 分 割 和 如 何 分 割 的 主要 因素 ;数据 分 析 处 理 的 要 求 是 选择 数据 
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分 割 标准 的 一 个 主要 依据 ,因为 数据 分 割 是 跟 数据 分 析 处 理 的 对 象 紧密 联系 的 ;此 外 还 要 考 
虑 到 所 选择 的 数据 分 割 标准 应 是 自然 的 易于 实施 的 ; 同时 也 要 考虑 数据 分 割 的 标准 与 粒 
度 划分 层次 是 适应 的 。 

物理 模型 根据 逻辑 模型 创建 , 它 是 通过 指定 主 码 和 指定 模型 的 其 他 物理 特性 来 扩展 巡 
辑 模型 而 得 到 的 。 物 理 模型 设计 阶段 的 主要 任务 是 确定 数据 仓库 的 存储 结构 .数据 的 存储 
位 置 和 索引 策略 。 


10.4.5 数据 挖掘 


随 着 数据 库 技术 的 不 断 发 展 及 数据 库 管理 系统 的 广泛 应 用 ,数据 库 中 存储 的 数据 量 急 
剧 增 大 ,在 大 量 的 数据 背后 隐藏 着 许多 重要 的 信息 。 如 果 能 把 这 些 信息 从 数据 库 中 抽取 出 
来 ,将 会 为 公司 创造 很 多 潜在 的 利润 。 而 这 种 从 海量 数据 库 中 挖 气 信 息 的 技术 ,就 称 之 为 数 
据 挖掘 (Data Mining,DM) 。 事 实 上 ,从 技术 角度 看 ,数据 挖掘 可 以 定义 为 从 大 量 的 \ 不 完全 
的 、 有 噪声 的 .模糊 的 以 及 随机 的 实际 数据 中 提取 隐 合 在 其 中 的 、 人 们 不 知道 的 .但 又 潜在 有 
用 的 信息 和 知识 的 过 程 。 


1. 数据 挖掘 的 分 类 


数据 挖掘 工具 能 够 对 将 来 的 趋势 和 行为 进行 预测 ,从 而 很 好 地 支持 人 们 的 决策 。 比 如 ， 
经 过 对 公司 整个 数据 库 系统 的 分 析 , 数 据 挖掘 工具 可 以 回答 诸如 “哪个 客户 对 我 们 公司 的 邮 
件 推销 活动 最 有 可 能 做 出 反应 ,为 什么 ”等 类 似 的 问题 。 有 些 数据 挖掘 工具 还 能 够 解决 一 些 
很 消耗 人 工时 间 的 传统 问题 ,因为 它们 能 够 快速 地 浏览 整个 数据 库 , 找 出 一 些 专家 们 不 易 察 
觉 的 极 有 用 的 信息 。 

对 数据 挖掘 技术 进行 分 类 可 以 有 多 种 角度 ,按照 所 挖掘 的 数据 库 种 类 可 分 为 关系 型 数 
据 库 的 数据 挖掘 、 数 据 仓库 的 数据 挖掘 、 面 向 对 象 数据 库 的 挖掘 、 空 间 数 据 库 的 挖掘 、 正 文 数 
据 库 的 数据 挖掘 和 多 媒体 数据 库 的 数据 挖掘 等 ; 按 所 发 现 的 知识 类 别 可 分 为 关联 规则 、 特 
征 描 述 、 分 类 分 析 、 聚 类 分 析 以 及 趋势 和 偏差 分 析 等 ; 按 所 发 现 的 知识 抽象 层次 可 分 为 一 般 
化 知识 ,初级 知识 和 多 层次 知识 等 。 

数据 挖掘 技术 是 人 们 长 期 对 数据 库 技术 进行 研究 和 开发 的 结果 。 起 初 各 种 商业 数据 是 
存储 在 计算 机 的 数据 库 中 的 ,然后 发 展 到 可 对 数据 库 进 行 查询 和 访问 ,进而 发 展 到 对 数据 库 
的 即时 遍历 。 数 据 挖掘 使 数据 库 技术 进入 了 一 个 更 高 级 的 阶段 , 它 不 仅 能 对 过 去 的 数据 进 
行 查询 和 遍历 ,并 且 能 够 找 出 过 去 数据 之 间 的 潜在 联系 ,从 而 促进 信息 的 传递 。 随 着 海量 数 
据 搜集 、 强 大 的 多 处 理 器 计算 机 和 数据 挖掘 算法 这 三 类 技术 的 发 展 和 成 熟 ,数据 挖掘 技 术 已 
在 数据 仓库 系统 中 得 到 了 广泛 的 应 用 。 数 据 挖掘 的 发 展 受 到 数据 库 系统 、 统 计 学 、 机 器 学 
习 、 可 视 化 技术 、 信 息 技术 及 其 他 学 科 的 影响 ,如 神经 网 络 .粗糙 集 理 论 .知识 表示 、 归 纳 技术 
与 高 性 能 计算 等 。 


2. 几 种 常用 的 数据 挖掘 算法 


(1) 人 工 神经 网 络 
人 工 神经 网 络 是 20 世纪 80 年 代 后 期 迅速 发 展 起 来 的 人 工 智 能 技术 ,仿照 生理 神经 网 
络 结构 的 非 线形 预测 模型 ,通过 学 习 进 行 模式 识别 。 它 对 噪声 数据 具有 很 高 的 承受 能 力 , 对 
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未 经 训练 的 数据 具有 分 类 模拟 的 能 力 , 因 此 在 网 站 信息 .生物 信息 和 基因 以 及 文本 的 数据 挖 
掘 等 领域 得 到 了 越 来 越 广泛 的 应 用 。 

(2) 决策 树 

决策 树 归纳 是 一 种 经 典 的 分 类 算法 。 它 采用 自 项 向 下 、 递 归 的 、 各 个 击破 的 方式 构造 决 
策 树 。 树 的 每 一 个 结 点 上 使 用 信息 增益 度量 选择 属性 ,可 以 从 所 生成 的 决策 树 中 提取 出 分 
类 规则 。 

(3) SVM 分 类 方法 

SVM 即 支持 向 量 机 法 ,该 方法 是 建立 在 统计 学 习 理论 基础 上 的 机 器 学 习 方 法 。 通 过 学 
习 ,SVM 可 以 自动 寻找 出 那些 对 分 类 有 和 较 好 区 分 能 力 的 支持 向 量 ,由 此 构造 出 的 分 类 器 可 
以 最 大 化 类 与 类 的 间隔 ,因而 有 较 好 的 适应 能 力 和 较 高 的 分 准 率 。 该 方法 只 需要 由 各 类 域 
的 边界 样本 的 类 别 来 决定 最 后 的 分 类 结果 。SVM 法 对 小 样本 情况 下 的 自动 分 类 有 着 较 好 
的 分 类 结果 。 

(4) 遗传 算法 

遗传 算法 是 基于 自然 进化 的 基本 理论 ,并 采用 遗传 结合 .遗传 变异 以 及 自然 选择 等 设计 
方法 的 优化 技术 。 遗 传 算法 很 容易 实现 并 行 运算 ,也 可 以 用 于 分 类 等 优化 问题 的 求解 。 在 
数据 挖掘 中 , 它 也 可 用 于 对 其 他 算法 的 适应 度 进行 评估 。 

(5) KNN 分 类 

KNN 分 类 即 K 最 近邻 法 。 该 方法 的 思路 非常 简单 直观 : 如 果 一 个 样本 在 特征 空间 中 
的 K 个 最 相似 ( 即 特征 空间 中 最 邻近 ) 样 本 中 的 大 多 数 属于 某 一 个 类 别 , 则 该 样本 也 属于 这 
个 类 别 。 该 方法 在 分 类 决策 上 只 依据 最 邻近 的 一 个 或 者 几 个 样本 的 类 别 来 决定 待 分 类 样本 
所 属 的 类 别 。 该 算法 较 适 用 于 样本 容量 比较 大 的 类 域 的 自动 分 类 ,而 那些 样本 容量 较 小 的 
类 域 采 用 这 种 算法 比较 容易 产生 误 分 。 


3. 数据 挖掘 与 数据 仓库 的 关系 


根据 数据 挖掘 的 定义 可 以 看 出 ,数据 挖掘 包含 一 系列 旨 在 数据 库 中 发 现 有 用 而 未 发 现 
的 模式 的 技术 ,如 果 将 其 与 数据 仓库 紧密 联系 在 一 起 ,将 会 获取 意外 的 成 功 。 若 将 数据 仓库 
比 作 矿坑 ,那么 数据 挖掘 就 是 深入 矿坑 采矿 的 工作 。 毕 竞 如 果 没 有 足够 丰富 完整 的 数据 ,是 
很 难 期 待 数据 挖掘 能 挖掘 出 什么 有 意义 的 信息 的 。 成 功 的 数据 挖掘 的 关键 之 一 在 于 只 有 访 
问 正确 、 完 整 和 集成 的 数据 ,才能 进行 深层 次 的 分 析 , 寻 求 有 益 的 信息 ,而 这 些 正 是 数据 仓库 
所 能 提供 的 。 数 据 仓库 不 仅 是 集成 数据 的 一 种 方式 ,数据 仓库 的 联机 分 析 功 能 OLAP 还 为 
数据 挖掘 提供 了 一 个 极 佳 的 操作 平台 。 如 果 数 据 仓库 与 数据 挖掘 能 够 实现 有 效 的 协同 ,将 
给 数据 挖掘 带 来 各 种 便利 和 功能 。 数 据 挖掘 也 为 数据 仓库 提供 更 好 的 决策 支持 ,促进 了 数 
据 仓库 技术 的 发 展 。 


4. 数据 挖掘 技术 的 应 用 过 程 

数据 挖掘 过 程 一 般 需要 经 历 确定 挖掘 对 象 、 准 备 数 据 、 建 立 模型 .数据 挖掘 、 结 果 分 析 与 
知识 应 用 这 样 几 个 阶段 。 

(1) 确定 挖掘 对 象 

数据 挖掘 的 第 一 步 是 要 定义 清晰 的 挖掘 对 象 , 认 清 数据 挖掘 的 目标 。 数 据 挖掘 的 最 后 
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结果 往往 是 不 可 预测 的 ,但 探索 的 问题 应 是 有 预见 性 的 有 目标 的 。 为 了 数据 挖掘 而 挖掘 数 
据 带 有 盲目 性 ,往往 是 不 会 成 功 的 。 在 定义 挖掘 对 象 时 ,需要 确定 这 样 的 问题 从 何 处 入 
手 ? 需要 挖掘 什么 数据 ? 要 用 多 少数 据 ? 数据 挖掘 要 进行 到 什么 程度 ? 尽管 在 数据 挖掘 中 
常常 事先 不 能 确定 最 后 挖掘 的 结果 到 底 是 什么 。 

有 时 还 要 用 户 提 供 一 些 先 验 性 知识 ,如 概念 树 等 。 这 些 先 验 性 知识 可 能 是 用 户 业 务 领 
域 知识 或 以 前 数据 挖掘 所 获得 的 初步 成 果 。 这 就 意味 着 数据 挖掘 是 一 个 过 程 ,在 挖 气 过程 
中 可 能 提出 新 的 问题 ,可 能 尝试 用 其 他 方法 来 检验 数据 ,在 数据 的 子 集 上 进行 同样 的 研究 。 
有 时 业务 对 象 是 一 些 已 经 理解 的 数据 ,但 在 某 些 情况 下 还 需要 对 这 些 数据 进行 挖掘 。 此 时 ， 
不 是 通过 数据 挖掘 发 现 新 的 有 价值 的 信息 ,而 是 通过 数据 挖掘 验证 假设 的 正确 性 ,或 者 是 通 
过 同样 方式 的 数据 挖掘 查看 模式 是 否 发 生变 化 。 如 果 在 经 常 性 的 同样 的 数据 挖掘 中 的 一 次 
挖掘 没有 出 现 以 前 同样 的 结果 ,这 意味 着 模式 已 经 发 生 了 变化 ,可 能 需要 进行 更 深层 次 的 挖 
据 。 例 如 ,将 数据 挖掘 应 用 于 客户 关系 管理 (CRM) 中 ,就 需要 对 客户 关系 管理 的 商业 主题 
进行 仔细 的 定义 。 每 个 CRM 应 用 都 有 一 个 或 多 个 商业 目标 ,要 为 每 个 目标 建立 恰当 的 模 
型 。 比 如 ,“ 提 高 客户 对 企业 促销 的 响应 率 ” 和 “提高 每 个 客户 的 响应 价值 ”这 两 个 目标 是 不 
同 的 ,并 且 在 定义 问题 的 同时 ,也 生成 了 评价 CRM 应 用 结果 的 标准 和 方法 , 即 确定 了 数据 
挖掘 的 评价 指标 。 

(2) 准备 数据 

在 确定 数据 挖掘 的 业务 对 象 后 ,需要 搜索 所 有 与 业务 对 象 有 关 的 内 部 和 外 部 数据 ,从 中 
选 出 适合 于 数据 挖掘 应 用 的 数据 。 对 数据 的 选择 必须 在 建立 数据 挖掘 模型 之 前 完成 。 选 择 
数据 后 ,还 需要 对 数据 进行 预 处 理 , 并 对 数据 进行 清洗 ,解决 数据 中 的 缺 值 . 宛 余数 据 值 的 
不 一 致 性 ,数据 定义 的 不 一 致 性 以 及 过 时 数据 等 问题 。 在 数据 挖掘 时 ,有 时 还 需要 对 数据 分 
组 ,以 提高 数据 挖掘 的 效率 ,降低 模型 的 复杂 度 。 

(3) 建立 模型 

将 数据 转换 成 一 个 分 析 模 型 ,这 个 分 析 模 型 是 针对 挖掘 算法 建立 的 。 建 立 一 个 真正 适 
合 挖掘 算法 的 分 析 模 型 ,是 数据 挖掘 的 关键 。 

(4) 数据 挖掘 

对 所 得 到 的 经 过 转化 的 数据 进行 挖掘 ,除了 完善 与 选择 合适 的 算法 需要 人 工 干预 外 , 数 
据 挖掘 工作 都 由 数据 挖掘 工具 自动 完成 。 

(5) 结果 分 析 

当 数 据 挖掘 出 现 结果 后 ,要 对 挖掘 结果 进行 解释 和 评估 。 具 体 的 解释 和 评估 方法 一 般 

应 根据 针对 数据 挖掘 结果 所 制定 的 决策 成 败 而 定 , 但 是 管理 决策 分 析 人 员 在 使 用 数据 挖掘 
结果 之 前 ,又 希望 能 够 对 挖掘 的 结果 进行 评估 ,以 保证 数据 挖掘 结果 在 实际 应 用 中 的 成 功 
率 。 因 此 ,在 对 数据 挖掘 结果 进行 评价 时 ,可 以 考虑 这 样 几 个 方面 的 问题 : 建立 模型 ， 人 
同 的 数据 集 在 模型 上 进行 操作 所 获得 的 结果 要 优 于 用 不 同 数据 集 在 模型 上 的 操作 结 
@ 模 型 的 某 些 结果 可 能 比 其 他 预测 结果 更 加 准确 ; a 
的 ,因此 实际 结果 往往 会 比 建 模 时 的 结果 差 。 另 外 ,利用 可 视 化 技术 可 将 数据 挖掘 结果 表现 
得 更 清楚 ,更 有 利于 对 数据 挖掘 结果 的 分 析 。 

(6) 知识 应 用 

数据 挖掘 的 结果 需要 经 过 业务 决策 人 员 的 认可 ,才能 实际 利用 。 要 将 通过 数据 挖掘 得 
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出 的 预测 模式 和 各 个 领域 的 专家 知识 结合 在 一 起 ,构成 一 个 可 供 不 同 类 型 的 人 使 用 的 应 
程序 。 也 只 有 通过 对 挖掘 知识 的 应 用 ,才能 对 数据 挖掘 的 成 果 做 出 正确 的 评价 。 但 是 ,在 应 
数据 挖掘 的 成 果 时 ,决策 人 员 关 心 的 是 数据 挖掘 的 最 终结 果 与 用 其 他 候选 结果 在 实际 应 
中 的 差距 。 以 往 在 进行 较 复杂 的 数据 分 析 时 ,专家 们 限于 时 间 因 素 ,不 得 不 对 参加 运算 的 
变量 和 数量 加 以 限制 ,但 是 那些 被 丢弃 而 没有 参加 运算 的 变量 有 可 能 包含 着 男 一 些 不 为 人 
知 的 有 用 信息 。 现 在 ,高 性 能 的 数据 挖掘 工具 让 用 户 能 对 数据 库 进 行 通盘 的 深度 遍历 ,并 且 
把 任何 可 能 参 选 的 变量 都 考虑 进去 ,再 也 不 需要 选择 变量 的 子 集 来 进行 运算 了 。 广 度 上 , 允 
许 有 更 多 的 行 存在 。 更 大 的 样本 使 得 产生 错误 和 变化 的 概率 降低 ,这 样 用 户 就 能 更 加 精确 
地 推导 出 一 些 虽 小 但 颇 为 重要 的 结论 。 


(os 其 他 新 型 的 数据 库 系统 


10.5.1 多 媒体 数据 库 系 统 


近年 来 , 随 着 多 媒体 数据 的 引入 ,对 数据 管理 方法 又 开始 酝酿 新 的 变革 。 传 统 的 数据 库 
所 处 理 的 是 字符 数值 类 数据 ,应 用 现 有 的 数据 库 理论 和 方法 可 把 现实 世界 抽象 为 数据 模型 ， 
即 实现 数据 的 规范 化 ,并 可 完成 对 数据 的 管理 。 当 图 形 、 图 像 、 声 音 及 视频 等 多 媒体 信息 引 
入 计算 机 之 后 ,可 表达 的 信息 范围 大 大 扩展 。 由 于 多 媒体 数据 不 规则 ,有 丰富 的 信息 含量 、 
复杂 的 结构 及 关系 ,并 有 巨大 的 数据 量 , 所 以 传统 的 数据 库 技术 如 数据 类 型 .数据 模型 操作 
语言 .存储 结构 , 存 取 路 径 、 检 索 机 制 以 及 网 络 和 数据 传递 等 都 不 能 适应 复杂 应 用 对 象 的 应 
用 需求 ,这 就 需要 一 种 新 的 管理 系统 对 多 媒体 数据 进行 有 效 的 组 织 、 管 理 和 存 取 。 这 种 把 多 
媒体 技术 和 数据 库 相 结合 的 数据 库 系统 称 为 多 媒体 数据 库 系统 。 多 媒体 数据 库 系 统 是 除了 
文本 和 其 他 离散 数据 外 ,还 能 够 存储 、 操 作 和 检索 音频 和 视频 等 连续 数据 的 数据 库 系统 。 可 
以 实现 以 下 功能 : 多 媒体 数据 库 对 象 的 定义 ; 多 媒体 数据 存 取 ; 多 媒体 数据 库 进行 控制 ; 
多 媒体 数据 组 织 ,存储 和 管理 ; 多 媒体 数据 库 建立 和 维护 ; 多 媒体 数据 库 在 网 络 上 的 通信 
功能 。 可 以 说 ,多 媒体 数据 库 是 数据 库 技术 与 多 媒体 技术 相 结 合 的 产物 。 与 传统 的 数据 库 
相 比 ,多 媒体 数据 库 具 有 以 下 特点 。 


1. 存储 和 处 理 的 信息 量 大 


常规 数据 的 数据 量 较 小 ,而 多 媒体 数据 的 数据 量 巨大 ,两 者 之 间 的 差别 可 大 到 几 千 ` 几 
万 甚至 几 十 万 倍 。 多 媒体 功能 要 求 对 分 布 在 不 同 辅助 存储 媒体 上 的 海量 信息 进行 数据 库 的 
管理 。 如 果 在 分 布 式 应 用 中 ,数据 需要 通过 网 络 进行 存 取 , 庞 大 的 数据 量 对 数据 库 技术 是 一 
种 严峻 的 考验 。 

2. 数据 长 度 不 确定 


常规 数据 在 组 织 存储 时 一 般 长 度 可 确定 ,可 用 定 长 记录 来 存储 ,因而 可 以 构造 成 一 张 张 
的 二 维 表 ,每 张 表 即 对 应 一 个 关系 ,每 一 行 表 示 一 个 元 组 ,每 一 列表 示 一 个 属性 ,每 个 数据 都 
是 不 可 再 分 的 原子 数据 , 存 取 方 便 , 结 构 简 单 。 而 多 媒体 数据 的 数据 量 大 小 不 定 , 长 度 难以 
预测 ,导致 数据 不 能 用 定 长 来 存储 ,数据 存储 过 程 比较 麻烦 。 
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3. 要 求实 现 同步 性 、 实 时 性 


连续 数据 流 对 多 媒体 数据 库 提出 了 实时 性 处 理 的 要 求 。 多 媒体 数据 ,无 论 是 声音 媒体 
还 是 视频 媒体 ,都 要 求 连续 传送 或 输出 ,否则 将 导致 严重 失真 ,影响 效果 。 这 就 要 求 多 媒体 
数据 库 系统 在 技术 上 实现 同步 性 、 实 时 性 。 


4. 数据 定义 及 操作 不 同 


传统 的 关系 数据 库 处 理 的 是 规范 关系 ,每 个 元 组 由 定 长 的 属性 值 组 成 ,而 每 个 属性 值 又 
是 不 可 再 分 的 原子 数据 。 因 而 ,对 这 些 规范 关系 可 方便 地 定义 并 施行 各 种 标准 操作 ,从 而 可 
为 用 户 提供 简明 的 数据 视图 以 及 使 用 简单 方便 而 功能 强大 的 SQL 语言 。 而 多 媒体 数据 不 
规则 ,有 丰富 的 信息 含量 、 复 杂 的 结构 及 关系 ,所 以 无 论 是 描述 语言 ,数据 操作 语言 或 存储 结 
构 , 存 取 路 径 等 都 和 传统 的 关系 数据 库 有 所 不 同 。 


5. 数据 复杂 性 增 大 


由 于 不 同 媒体 之 间 的 特性 差异 很 大 ,因此 增加 了 数据 库 在 管理 和 处 理 这 些 媒 体 数 据 时 
的 复杂 性 。 通 常 的 多 媒体 数据 库 中 ,音频 、 视 频 、 图 像 都 存在 ,为 了 管理 方便 ,应 尽 可 能 把 上 
述 三 种 媒体 存放 在 不 同 的 表 中 ,然后 通过 外 键 进行 连接 。 


10.5.2 空间 数据 库 系统 
1. 空间 数据 


所 谓 空间 数据 是 指 与 空间 位 置 和 空间 关系 相 联系 的 数据 。 每 个 空间 对 象 都 具有 空间 坐 
标 , 即 空间 对 象 隐 含 了 空间 分 布 特征 。 这 意味 着 在 空间 数据 组 织 方面 ,要 考虑 它 的 空间 分 布 
特征 。 空 间 数据 量 比 一 般 的 通用 数据 库 要 大 得 多 ,通常 称 为 海量 数据 。 正 因为 空间 数据 量 
大 ,所 以 需要 在 二 维 空间 上 划分 块 或 者 图 幅 , 在 垂直 方向 上 划分 层 来 进行 组 织 。 空 间 数据 通 
常 具有 非 结构 化 的 特征 。 在 一 般 的 关系 数据 库 管 理 系 统 中 ,数据 记录 一 般 是 结构 化 的 , 即 它 
满足 关系 数据 模型 的 第 一 范式 要 求 ,每 一 条 记录 都 是 定 长 的 ,数据 项 表达 的 只 能 是 原子 数 
据 , 不 允许 内 套 记 录 。 而 空间 数据 则 不 能 满足 这 种 结构 化 要 求 。 若 用 一 条 记录 表达 一 个 空 
间 对 象 , 它 的 数据 项 可 能 是 变 长 的 , 它 不 满足 关系 数据 模型 的 范式 要 求 , 这 也 是 空间 图 形 数 
据 难 以 直接 采用 一 般 的 关系 数据 管理 系统 的 主要 原因 。 


2. 空间 数据 库 系统 


空间 数据 库 是 关于 某 一 区 域内 一 定 地理 要 素 特征 的 数据 集合 ,是 地 理 信息 统 中 空间 数 
据 的 存储 场所 ,在 整个 地 理 信息 系统 中 占有 极其 重要 的 地 位 ,是 地 理 信息 系统 发 挥 功能 和 作 
的 关键 。 空 间 数据 库 以 地 理 空间 数据 存储 和 操作 为 对 象 ,把 被 管理 的 数据 从 一 维 推 向 了 
二 维 、 三 维 甚至 更 高 维 。 由 于 传统 数据 库 系统 的 数据 模型 主要 针对 简单 对 象 , 因而 无 法 有 效 
也 支持 以 图 形 .影像 等 复杂 对 象 为 主体 的 工程 应 用 。 空 间 数据 库 系统 的 形成 和 发 展 , 是 数据 
存储 和 管理 的 需要 ,也 是 传统 数据 库 系统 在 空间 的 扩展 。 从 概念 上 讲 ,空间 数据 库 系 统 是 
于 采集 存储, 管理, 检索、 分析 和 表达 空间 数据 和 属性 数据 的 计算 机 系统 ,能 够 对 海量 数据 
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进行 存储 和 管理 。 空 间 数据 库 是 随 着 地 理 信 息 系统 的 开发 和 应 用 发 展 起 来 的 数据 库 新 技 
术 。 空 间 数据 库 系统 应 用 紧密 结合 ,大 多 数 以 地 理 信 息 系统 的 基础 和 核心 的 形式 出 现 。 空 
间 数 据 库 系统 必须 具备 对 地 理 对 象 进行 模拟 推理 的 功能 。 一 方面 可 将 空间 数据 库 技术 视 为 
传统 数据 库 技术 的 扩充 。 空 间 数 据 库 系统 的 扩充 部 分 包括 空间 数据 模型 .空间 关系 、 空 间 查 
询 语言 .空间 索引 ,空间 查询 处 理 与 优化 、 空 间 数 据 库 实 现 技 术 、 并 行 分 布 式 空间 数据 库 系 统 
和 空间 数据 仓库 。 另 一 方面 ,空间 数据 库 突破 了 传统 数据 库 理 论 ,其 实质 性 发 展 必 然 导 致 理 
论 上 的 创新 。 


10.5.3 模糊 数据 库 系 统 


1965 年 Zadeh 提出 模糊 集合 理论 ,这 对 几乎 所 有 的 数学 分 支 都 产生 了 重要 影响 ,应 
遍及 各 个 领域 。 在 数据 库 理论 与 技术 中 使 用 模糊 理论 ,开始 于 1979 年 Buckles 等 人 建立 的 
模糊 数据 库 理论 ,而 国际 上 对 模糊 数据 库 的 研究 主要 是 从 20 世纪 80 年 代 开始 的 , 旨 在 克服 
传统 数据 库 难以 表达 和 处 理 模糊 信息 的 特点 ,进而 扩展 数据 库 的 功能 ,开拓 更 新 更 广 的 
领域 。 

传统 数据 库 仅 允许 对 精确 数据 进行 存储 和 处 理 , 而 客观 世界 中 有 许多 事物 是 不 精确 的 。 
模糊 数据 库 的 研究 和 实践 就 是 为 了 解决 模糊 数据 的 表达 和 处 理 问 题 ,使 得 数据 库 描述 的 模 
型 能 更 自然 ,更 贴切 地 反映 客观 世界 。 从 概念 上 讲 ,模糊 数据 库 是 指 能 够 处 理 模糊 数据 的 数 
据 库 , 它 是 研究 如 何在 数据 中 表示 、 存 储 和 管理 模糊 数据 的 一 门 学 科 , 也 是 数据 库 领 域 的 一 
个 重要 分 支 。 与 传统 数据 库 不 同 ,模糊 数据 库 中 数据 本 身 是 模糊 的 ,包括 模糊 数据 变量 和 模 
糊 语 言 变 量 。 数 据 间 的 联系 以 及 依赖 关系 也 是 模糊 的 ,数据 完整 性 ,一 致 性 等 约束 条 件 以 及 
数据 定义 数据 操纵 和 数据 查询 等 都 具有 模糊 性 。 实 现 模 糊 数据 库 , 要 研究 模糊 算法 ,模糊 
逻辑 和 模糊 推理 等 方面 的 理论 ,方法 和 技术 问题 具有 一 定 的 困难 。 由 于 关系 数据 库 是 数据 
库 逻 辑 模型 中 最 简单 的 ,因此 最 早 研究 出 来 的 都 是 一 些 模糊 关系 型 数据 库 的 数据 模型 。 此 
后 大 量 的 工作 集中 在 模糊 关系 数据 库 方面 , 即 对 关系 数据 库 进 行 模糊 扩展 ,提出 了 各 种 模糊 
关系 数据 模型 .模糊 关系 数据 库 语 言 模型 和 模糊 关系 数据 库 的 物理 组 织 形式 等 ,并 对 传统 数 
据 库 中 的 相关 概念 进行 了 新 的 定义 ,如 模糊 关系 ,模糊 数据 字典 ,模糊 运 算 符 和 模糊 操作 
符 等 。 

近年 来 ,模糊 数据 库 的 重心 从 模糊 性 扩展 到 关系 数据 库 模 型 的 理论 框架 研究 ,如 模糊 网 
络 数 据 模型 .模糊 层次 数据 模型 .模糊 关系 数据 模型 .面向 对 象 的 模糊 数据 模型 ,模糊 逻辑 数 
据 模 型 ,模糊 演绎 数据 模型 .模糊 知识 库 模 型 等 。 模 糊 数 据 库 与 专家 系统 、 知 识 库 等 技术 的 
结合 也 是 模糊 数据 库 技术 的 研究 方向 。 


10.5.4 智能 数据 库 系 统 


智能 数据 库 是 数据 库 技术 和 人 工 智能 技术 相 结合 的 产物 。 从 人 工 智 能 领域 寻求 和 吸收 
新 的 思想 .理论 和 方法 ,将 其 与 传统 数据 库 理论 与 技术 相 结合 ,推出 新 的 数据 模型 ,建立 和 实 
现 新 一 代 的 数据 库 系 统一 一 智能 数据 库 。 智 能 数据 库 研究 利用 人 的 推理 ,想象 .记忆 原理 , 实 
现 对 数据 库 的 存储 、 搜 索 和 修改 。 智 能 数据 库 通过 有 效 的 组 织 ,能够 满足 人 们 快速 检索 和 修改 
数据 库 的 要 求 。 智 能 数据 库 思 想 的 提出 ,预示 着 人 类 的 信息 处 理 即将 步 人 一 个 轩 新 的 时 代 。 
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1. 人 工 智能 


人 工 智能 (Artificial Intelligence, AD 是 研究 、 开 发 用 于 模拟 、 延 伸 和 扩展 人 的 智能 的 理 
论 ` 方 法、 技术 及 应 用 系统 的 一 门 新 的 技术 科学 。 人 工 智能 是 计算 机 科学 的 一 个 分 支 , 也 被 
认为 是 21 世纪 世界 三 大 尖端 技术 之 一 。 

“人 工 智 能 ”一 词 最 初 是 在 1956 年 Dartmouth 学 会 上 提出 的 。 从 那 以 后 ,研究 者 们 发 
展 了 众多 理论 和 原理 ,人 工 智 能 的 概念 也 随 之 扩展 。 美 国 斯 坦 福 大 学 人 工 智 能 研究 中 心 的 
尼 尔 逊 教授 对 人 工 智能 给 出 了 如 下 定义 : 人 工 智 能 是 关于 知识 的 学 科 一 一 怎样 表示 知识 以 
及 怎样 获得 知识 并 使 用 知识 的 科学 。 美 国 麻 省 理工 学 院 的 温 斯 顿 教授 认为 : “人工 智 能 就 
是 研究 如 何 使 计算 机 去 做 过 去 只 有 人 才能 做 的 智能 工作 。” 

这 些 说 法 反映 了 人 工 智 能 学 科 的 基本 思想 和 基本 内 容 , 即 人 工 智 能 是 研究 人 类 智能 活 
动 的 规律 ,构造 具有 一 定 智 能 的 人 工 系统 ,研究 如 何 让 计算 机 去 完成 以 往 需要 人 的 智力 才能 
胜任 的 工作 ,也 就 是 研究 如 何 应 用 计算 机 的 软 硬 件 来 模拟 人 类 某 些 智 能 行为 的 基本 理论 . 方 
法 和 技术 。 

可 以 说 ,人 工 智 能 是 一 门 极 富 挑战 性 的 边缘 学 科 , 除 了 计算 机 科学 以 外 ,人 工 智 能 还 涉 
及 信息 论 .控制 论 .自动 化 ` 仿 生 学 .生物 学 ,心理 学 .数理 逻辑 .语言 学 ` 医 学 和 哲学 等 多 门 学 
科 。 总 的 说 来 ,人 工 智能 研究 的 一 个 主要 目标 是 使 机 器 能 够 胜任 一 些 通常 需要 人 类 智能 才 
能 完成 的 复杂 工作 。 


2. 智能 数据 库 


智能 数据 库 是 数据 库 技术 和 人 工 智能 技术 相 结合 的 产物 。 智 能 化 的 数据 库 是 将 人 工 智 
能 技术 与 传统 数据 库 理论 与 技术 相 结 合 ,推出 新 的 数据 模型 ,使 其 不 但 具有 传统 数据 库 的 现 
有 功能 ,还 扩展 了 如 下 一 些 AI 能 力 , 以 提高 数据 库 的 演绎 、 推 理 功 能 和 智能 化 的 程度 。 

(1) 数据 库 的 演绎 功能 

利用 AI 技术 ,能 从 现 有 数据 库 的 数据 中 演绎 和 推导 出 一 些 新 数据 。 

(2) 数据 库 的 搜索 功能 

将 数据 库 中 的 操作 视 为 AI 中 的 问题 求解 一 一 搜索 ,利用 人 工 智能 算法 ,实现 数据 库 的 
智能 检索 和 查询 优化 。 

(3) 数据 库 的 问题 求解 能 力 

将 知识 表示 和 知识 处 理 为 主 的 专家 系统 技术 与 数据 管理 为 主 的 数据 库 技术 相 结 合 ， 
发 出 能 共享 信息 的 面向 知识 处 理 的 问题 求解 系统 。 

(4) 数据 库 的 归纳 功能 

利用 AI 技 术 , 将 数据 库 中 的 数据 归纳 成 规则 , 存 入 知识 库 , 进 一 步 发 展 即 可 使 数据 库 
具有 学 习 能 力 。 

(5) 数据 库 的 知识 管理 能 力 

在 数据 库 只 能 管理 事实 数据 的 基础 上 ,再 加 以 扩充 ,使 其 具有 管理 事实 与 规则 的 功能 ， 
即 管理 知识 的 能 力 。 

智能 数据 库 将 计算 机 科学 中 近年 来 日 趋 发 展 成 熟 的 几 种 主要 技术 ,面向 对 象 技术 .数据 
库 技术 、 人 工 智能 集成 为 一 体 。 智 能 数据 库 系 统 是 一 个 对 象 数 据 库 管理 系统 。 体 系 结构 的 
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选择 对 它 的 性 能 和 功能 有 非常 重要 的 影响 。 在 体系 结构 的 选择 过 程 中 我 们 始终 遵循 这 样 的 
一 条 准则 : 性 能 更 为 重要 。 因 为 功能 可 以 在 ODBMS 上 层 的 应 用 程序 中 增加 ,而 性 能 上 的 
缺陷 是 不 可 能 在 应 用 程序 层次 上 得 以 弥补 的 。 


fo.6 本 章 小 结 


本 章 介 绍 数据 库 技术 的 新 发 展 ,其 中 ,面向 对 象 数据 库 是 数据 库 技术 与 面向 对 象 程序 设 
计 方 法 的 结合 ; 分 布 式 数据 库 是 数据 库 技术 与 网 络 通信 技术 的 结合 ; Web 数据 库 是 数据 库 
技术 与 Web 技术 的 结合 ; 数据 仓库 是 数据 库 技术 与 人 工 智能 技术 的 结合 。 另 外 ,还 介绍 了 
面向 特定 应 用 领域 的 一 些 新 型 数据 库 系 统 。 


(i0.7 习题 


10.7.1 名 词 解 释 
面向 对 象 数据 模型 .分布 式 数据 库 系统 .并 行 数据 库 系统 .数据 仓库 .数据 挖掘 
10.7.2 简 答题 


. 简 述 面向 对 象 数据 库 系统 的 基本 特征 。 
. 简 述 分 布 式 数据 库 的 特点 。 

. 简 述 数据 仓库 的 基本 特性 。 

. 简 述 数据 挖掘 技术 的 应 用 过 程 。 
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